关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:011598人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

本科生因"逆天学术履历"引争议 学校回应:正在核查中

封面新闻 浏览 700 07-16

马卡:德容回归后卡萨多不太可能获得机会,但后者不会离开

懂球帝 浏览 18 08-25

花87万办了300年健身卡 浙江男子直呼:当时昏头了

环球网资讯 浏览 1477 08-03

史上续航最长特斯拉Model 3来了 续航830km/售26.95万起

太平洋汽车 浏览 711 08-13

袁立吐槽章子怡张国立上节目拿几千万酬劳

赵仔说 浏览 1247 08-10

透露动态!陈梦备战全运会即将回归赛场,坦言自己是ESFP人格

乒谈 浏览 2156 07-21

赵露思八问银河酷娱"你震惊什么 在业内到处说我装病"

极目新闻 浏览 5451 08-04

女子手拿电话骑电动车摔倒 数米远的对向车被认定次责

扬子晚报 浏览 6183 08-11

官方:升班马克雷莫纳签下莱切后卫巴斯奇罗托,转会费300万欧

直播吧 浏览 4016 07-30

马云夜骑西湖被网友偶遇 同款自行车卖1.85万元

每日经济新闻 浏览 1069 07-18

命运曲折!传H20芯片停产,英伟达这样回应

网易科技报道 浏览 13 08-22

贵州茅台:控股股东拟增持30亿-33亿元公司股票

网易财经 浏览 13 08-30

解放军仪仗队首次应邀赴越南参加阅兵

北京日报客户端-长安街知事 浏览 6681 05-02

从高光到至暗 广汽菲克工厂腰斩价无人接盘宣布破产

道哥说车 浏览 5373 07-10

抗日名将吉鸿昌后人回忆外祖父遗书:为时代而牺牲

红星新闻 浏览 1073 08-09

国际IP亲子主题乐园来了 中国首座乐高乐园®开园迎客

网易汽车 浏览 7464 07-07

外卖平台下场“开店”,凭什么“圈粉”餐饮企业大品牌?

凤凰WEEKLY财经 浏览 8323 07-29

巴奴冲刺港股,餐饮投资逻辑变了

伯虎财经 浏览 5993 07-24

42岁男子脑出血离世 8岁女儿哭着说"听不到你唱歌了"

极目新闻 浏览 3139 08-16

微胖女生春日逆袭!5件显瘦神单品 + 万能搭配公式,梨形变纸片人

Yuki女人故事 浏览 5333 05-27

具俊晔深情人设翻车!年轻时抛弃大S,人不在了守着墓地毫无意义

萌神木木 浏览 5278 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3