关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:011709人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

总投资52亿元:国内首个海上回收复用火箭基地顺利开工

IT之家 浏览 91 01-09

直播间引流卖假货、申请退款即“失联”!最新曝光来了!

中国基金报 浏览 9587 08-07

媒体:日本参议院选举或影响政局 石破茂面临下台压力

澎湃新闻 浏览 7959 07-21

东体:蓝血人变身白衣天使,医生帮病人恢复心跳后受邀观申花训练

直播吧 浏览 8085 07-28

美政府从对华出口芯片“抽成”引哗然

环球网资讯 浏览 3611 08-12

官方:法国队补招埃基蒂克,顶替因伤退出的谢尔基

懂球帝 浏览 93 09-01

西班牙数千民众在马德里游行 抗议北约提高军费目标

环球网资讯 浏览 1557 06-09

中年女人少穿黑色和灰色,年轻色穿出减龄效果,看起来嫩十岁

静儿时尚达人 浏览 3610 06-14

罗马诺:奥斯梅恩今日抵达土耳其,莫拉塔的转会或将被激活

懂球帝 浏览 5063 07-31

放下执念的李斌,向前看的蔚来

观察者网 浏览 146 08-23

杭州高架理想MEGA起火,车主:理想救我一命 高管:感谢认可事故正了解中

红星资本局 浏览 9796 08-07

夏天最好看的4件套装,高级又气质!

LinkFashion 浏览 6977 06-09

跨年档12部新片来袭!没有大片全是情怀,55岁古天乐对打71岁成龙

萌神木木 浏览 76 12-11

为什么法国女人穿牛仔,看上去很舒服?

Yuki女人故事 浏览 9083 06-05

娃哈哈到底是谁的?

有数DataVision 浏览 3741 07-31

独居安全APP“死了么”登顶苹果应用付费榜,功能短板遭用户吐槽,已出现多款类似软件

扬子晚报 浏览 76 01-15

杨鸣:广东三外援轮番冲击让我们顾此失彼;今晚年轻人的表现值得表扬

懂球帝 浏览 78 01-12

看到古力娜扎版嫦娥仙子,才知啥叫气质比脸更重要,木头美人

温柔娱公子 浏览 108 10-17

王贻芳院士:AI离人脑还有巨大差距

网易财经 浏览 7989 08-05

特斯拉在欧洲加速推广FSD!新增试驾体验,产品进入全新国家

车东西 浏览 81 01-27

当年霍震霆给儿子霍启刚挑儿媳妇,眼光多毒啊

小光侃娱乐 浏览 99 11-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3