关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:011661人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今日热点:文淇工作室已取证;碧梨又破纪录了……

伊周潮流 浏览 9 01-10

从穿搭到生活,秋天适合“慢”下来

LinkFashion 浏览 64 10-11

特斯拉智能辅助驾驶里程已超100亿公里

大象新闻 浏览 43 11-27

区情|玩转杨数浦,京东自提服务打造数商融合消费新体验!

上观新闻 浏览 23 01-02

这个十一假期,打败酒店行业的是帐篷?

BT财经 浏览 72 10-11

九三阅兵宣传曲MV上线:受阅一次成就一生荣光

人民日报 浏览 49 08-28

千万粉丝网红"猴哥说车"官宣离婚:缘分尽了 和平离婚

扬子晚报 浏览 95 10-09

光模块双雄:高增长审美疲劳 高估值面临压力

21世纪经济报道 浏览 63 11-01

网红卫生巾「翻车」,辛巴又栽了?

豹变 浏览 1078 07-26

抢先看:60秒混剪盛大阅兵训练

人民日报 浏览 78 08-28

商竣程复出无缘首胜疑似又受伤,17万能抚平排名跌出TOP100之痛?

网球之家 浏览 2634 07-29

全球首款主动安全 AI 电芯量产,德赛电池自主研发

IT之家 浏览 9414 07-27

留几手称不在意葛夕恋情,又说不能接受,他咋了

新金牌娱乐观察家 浏览 5348 07-31

北京这一天,陈晓秒了罗一舟,短剧男主和长剧男主一眼看出差别

娱乐圈笔娱君 浏览 38 11-25

公司中标后县政府迟迟不签约 百万元前期投入"打水漂"

新京报 浏览 13 01-15

央视年代剧《老舅》开播!这部剧又要火向全国

皮皮电影 浏览 18 12-22

无限扫描,将400年前的世界一键装进手机

现代快报 浏览 2757 07-24

方圆X阿爆,爆款连出一个月,她们凭什么?

时尚COSMO 浏览 118 10-01

泽连斯基发声 :没有任何迹象表明俄方准备结束战争

每日经济新闻 浏览 8411 08-16

贝拉尔多辟谣离队传闻:在巴黎非常开心,会全力以赴实现目标

懂球帝 浏览 30 11-01

54岁古天乐国外隐婚?王晶又曝大瓜

聚合大娱 浏览 5573 07-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3