关闭广告

阶跃星辰姜大昕:Step 3是推理时代最适合应用的模型

网易科技报道2025-07-26 00:00:019679人阅读

7月25日消息,在2025世界人工智能大会前夕,星辰在上海发布了新一代基础大模型—— 3。据介绍,作为阶跃的主力基座模型,Step 3兼顾智能与效率,旨在面向时代打造最适合应用的模型。Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多推理模型。

同时,阶跃星辰还宣布联合多家国内领先的芯片、平台厂商发起成立“模芯生态创新联盟”,将通过推动模型和芯片产业链联合创新,加速大模型应用的落地。此外,阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。

现场,阶跃星辰创始人、CEO姜大昕表示:“从Step 1到Step 2两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代Step 3基础模型的出发点。”

具体来看,新一代基模 Step 3号称是推理时代最适合应用的模型。阶跃星辰提出,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征。唯有模型全面发展,才能让模型真正用起来。

首先,不妥协的性能,Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、工程协同设计上的一次大胆尝试与Scale Up。Step 3采用 MoE 架构,总参数量321B,激活参数量38B。

与此同时,Step 3拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的SOTA成绩。

其次,极致成本,据介绍,在确保性能的前提下,阶跃星辰持续推进模型成本优化。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

据了解,在架构设计阶段,Step 3便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。这些结果充分验证了 Step 3具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

据悉,阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行Step 3。其它联盟厂商的适配工作正在开展。

资料显示,阶跃星辰战略性聚焦智能终端Agent的方向,重点布局汽车、手机、IoT设备等关键应用场景。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

收视爆了,梅婷一出手,就破了央视尺度!这剧能过审真是逆天

娱乐圈笔娱君 浏览 2 01-26

驻韩美军一“死神”无人机失控坠海 9月才被部署在朝鲜半岛

红星新闻 浏览 34 11-26

舞蹈与千年古镇碰撞 第二季新市古镇舞蹈艺术季启幕

国是直通车 浏览 54 10-26

2025最妖ST股:暴涨8倍,7000人吃饱,人均赚105万

壹只灰鸽子 浏览 95 08-23

专家:诺贝尔化学奖获奖项目产业化或率先在中国实现

上观新闻 浏览 108 10-09

雷克萨斯IS再出招、全车黑化,8月上市

MOTO 浏览 8461 07-29

中国新一代旗舰大模型宣布开源

环球网资讯 浏览 4173 07-29

乒超联赛第二阶段收官:山东魏桥、山东鲁能、深圳大学领跑

懂球帝 浏览 7494 07-29

“日产工厂辉煌了60年,被特斯拉和中企打得措手不及”

观察者网 浏览 5377 08-19

东北6家城商行改革进度披露,1家有新进展、5家尚在化险期

湘财Plus 浏览 4577 07-29

特朗普:美国与墨西哥的关税协议将延长90天

界面新闻 浏览 9427 08-01

AI编程终于“开箱即用”了?Qwen3-Coder或许是那个质变节点

硅星人 浏览 9216 07-24

这一次韩红拒绝上综艺,彻底撕开了娱乐圈的体面

新语爱八卦 浏览 3761 07-20

从渠道困局到“黄金时代”,独立游戏大热的背后逻辑是什么?

时代周报 浏览 7298 07-29

限时19.68万元起 比亚迪2026款夏上市

网易汽车 浏览 48 11-06

夏天裙子别越买越多,选择适合自己的才最重要,优雅又得体

静儿时尚达人 浏览 119 09-08

贾乃亮“好男人”的口碑,掌握在女儿甜馨的手中

素衣读史 浏览 399 07-25

王兴兴直指人形机器人这两大致命瓶颈

网易数码 浏览 70 09-25

西北大学教授刘建妮 被撤销“中国青年女科学家奖”

每日经济新闻 浏览 117 09-22

牛市狂欢中,一大波减持公告来袭

深蓝财经 浏览 2560 07-25

纵横G700预售34.99万起 奇瑞家的高端硬派越野

网易汽车 浏览 76 09-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3