关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:011662人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

法国队史第3次闯入U20世界杯半决赛,此前一次夺冠一次第4

懂球帝 浏览 38 10-13

理想取消i8 Pro,将i8 Max改为标配并降价

网易科技报道 浏览 5924 08-06

小米YU7交付量突破4万台 推出高端定制服务

网易汽车 浏览 64 09-27

赛后称德国女足不配取胜,法国女足国脚道歉:当时情绪上头了

懂球帝 浏览 8839 07-21

黄磊宣传乌镇用力过猛!戏剧节变夜店蹦迪现场,明星狂欢惹争议

萌神木木 浏览 67 10-21

微软秘密武器亮相,英伟达CUDA护城河遭遇直接冲击

IT之家 浏览 37 11-10

布斯克茨本赛季末退役后,传奇中场组合“哈白布”将全部退役

懂球帝 浏览 57 09-26

威刚展示SD 8.0标准SDXC存储卡:顺序读取1.6 GB/s

IT之家 浏览 19 01-06

丰田全新四缸发动机轻松突破600马力,内燃机技术超越德国品牌!

郑谊 浏览 1641 07-02

今年夏天“微透风”火出圈了,这样穿时髦松弛又减龄

LinkFashion 浏览 3627 07-04

175款智慧康养机器人产品将亮相成都!记者提前探馆带你体验

红星新闻 浏览 53 10-29

峰值 4000 尼特与全屏 10000 尼特,尊正展示超高亮度显示产品

IT之家 浏览 7137 08-13

董璇母女国庆节跳舞 小酒窝眼神坚定

扒虾侃娱 浏览 50 10-02

西贝降价网友不买账称"利润这么大""还是贵" 客服回应

极目新闻 浏览 100 10-02

罗马诺:奥斯梅恩今日抵达土耳其,莫拉塔的转会或将被激活

懂球帝 浏览 5007 07-31

特鲁多与水果姐约会被拍下 肢体语言亲密无间眼神拉丝

新民周刊 浏览 9695 08-04

中国海警船驱离菲巡逻船与军舰发生冲撞 国防部回应

环球网资讯 浏览 3203 08-16

美方在公海海域扣押悬挂俄罗斯国旗的油轮 外交部回应

澎湃新闻 浏览 14 01-09

观众说段奕宏用力过猛 为何央媒却专门点名表扬?

阿校谈史 浏览 2653 07-29

智己汽车首获上海新一批智能网联汽车示范运营牌照

IT之家 浏览 9822 07-27

看来阿里要发力扶持盒马了

蓝鲸新闻 浏览 9147 08-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3