关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:011627人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

在长江源,如何为冰川做“体检”?

新华社 浏览 5617 08-03

匈牙利总理:欧洲已输掉俄乌冲突 却不敢承认

鲁中晨报 浏览 1712 07-14

"暴躁十亿姐"被封号:自称润田创始人妻子 老公4婚5娃

极目新闻 浏览 15 10-17

夏天,要穿赫本的白裙呀!

Yuki女人故事 浏览 9835 05-14

取消在越南停靠计划 美航母驶向中东

每日经济新闻 浏览 8002 06-18

蒋欣的“眼光”真没错!看了《朝雪录》才发现,李兰迪面相早变了

温柔娱公子 浏览 9264 07-19

狗狗被宠物店放烘干箱一小时活活烤死 门店谎称是中暑

极目新闻 浏览 7972 07-24

中金公司上半年净利润同比增长94% 聘任王曙光为新一任总裁

网易财经 浏览 42 08-30

原正厅长级巡视专员申勇受审 曾被通报泄露工作秘密

红星新闻 浏览 38 09-26

61岁印度富婆被首富丈夫宠成少女 比女儿和儿媳都白嫩

照见古今 浏览 9667 08-08

00小花,怎么不算人均母胎美人呢?

时尚COSMO 浏览 7878 07-26

无人曝光?董璇二婚,意外推翻了宁静的话

可乐谈情感 浏览 9471 07-16

四大粮商坐不住了,中国在非洲建农业基地,将改写全球粮食格局

北向财经 浏览 689 07-27

全国首个语料运营公共服务统一门户在沪发布,为AI提供更好的“燃料”

文汇报 浏览 7446 07-29

鲁政委:寻求创新与监管的再平衡——美国加密资产发展方向

首席经济学家论坛 浏览 45 08-25

海信发布两款颠覆级激光显示新品,显示产业形态创新迈向关键拐点

IT之家 浏览 35 09-22

新月联赛首轮首发:努涅斯、米林科维奇、鲁本-内维斯出战

直播吧 浏览 45 08-30

纯电增程可选/车长超5米 福特烈马新能源申报图曝光

网易汽车 浏览 2277 07-17

中东热战,中国车企是进是退?

汽车人传媒 浏览 3815 06-23

马奎尔:球员最好远离社交媒体;要把曼联带回其应有的位置

懂球帝 浏览 49 08-22

腾讯想做机器人的“大脑”供应商,现阶段不追求商业化

南方都市报 浏览 4947 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3