关闭广告

观察|国产算力从单点突破转向系统级创新,厂商齐推超节点,“光”迎来了高光时刻

澎湃新闻2025-07-30 00:00:027640人阅读

7月26日-28日,全球顶级的AI大会世界人工智能大会(WAIC 2025)在上海召开,为全球产业变革提供关键技术支点与战略前瞻洞察。作为人工智能产业链重要一环,本届WAIC也聚集了本土一众算力芯片厂商,其中,华为384超节点真机首次线下亮相引发了广泛的关注。此外,摩尔线程、沐曦、燧原、曦智科技等都展出了自己最新的产品和解决方案。

澎湃新闻记者观察到,在算力芯片制程受限的情况下,产业界转向超节点集群以及产业链多个环节协同创新方式来解决当下算力需求。特别值得一提的是,算力前沿领域的光互联光交换技术也取得了一系列突破性进展。


2025年7月26日,上海世博展览馆,华为昇腾超节点技术突破384卡高速互联,通信带宽提升15倍,使千亿级模型性能提升2.5倍以上。澎湃新闻记者 朱伟辉 图

厂商齐推超节点推动算力进入“万卡协同”时代

本次大会,华为首次把384超节点真机搬到展台,从而引发了观众广泛关注。

华为超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,算力规模300 PFlops,成功打破跨机通信带宽性能瓶颈,实现从服务器级到矩阵级的资源供给模式转变。

此外,华为云的昇腾AI云服务,让超节点能够以云服务的形态实现按需用、随心用,降低企业应用先进智算基础设施的门槛,目前基于CloudMatrix 384超节点的华为云新一代昇腾AI云服务目前已在芜湖、贵安、乌兰察布、和林格尔数据中心全面上线。

万亿参数大模型与多模态训练的崛起,正推动算力集群迈入“万卡协同”时代。超节点架构通过深度整合GPU资源,在超节点内构建起低延迟、高带宽的统一算力实体,已成为支撑这一演进的关键技术路径。

一位芯片行业人士接受澎湃新闻记者采访时表示,之前英伟达推出了NVL 72方案,专注为万亿参数大模型提供训练算力,这也是行业的共识,大家都会走超节点集群路线。此外,本土芯片制程受限,单芯片突破比较难,超节点把更多卡放在一起,从而满足高参数大模型训练需求。

同样的,摩尔线程在WAIC上首次提出“AI工厂”理念,从单芯片转向系统级创新来突破大模型训练效率瓶颈。

摩尔线程提出的“AI工厂”,如同芯片晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层芯片架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。

“光”迎来了高光时刻

本届WAIC,曦智科技联合壁仞科技、中兴通讯共同推出的光跃LightSphere X——全球首个分布式光互连光交换GPU超节点解决方案,凭借其突破性原始创新获得了大会2025 SAIL奖(卓越人工智能引领者奖)。


需要指出的是这是一个真实落地的算力方案,即将落地在上海仪电的国产算力集群。

曦智科技的“全光”方案为厂商部署超节点方案提供了新思路。大型计算集群成千上万颗GPU一起协同工作,连接他们的“神经”——传统的电缆在长距离传输高带宽信号时,会产生巨大的延迟和功耗,这限制了集群的规模和效率。

这时,人们目光锁定了“光”,光带宽更高、延迟更低、能耗也更小。英伟达在交换机上率先引入了CPO(光电共封装)技术,把光模块和交换芯片封装在一起,缩短了电信号的传输距离,从而降低了衰减和功耗。曦智科技也是一家追“光”者,专注于“光子计算+光子网络”两大领域。

该超节点的核心技术就是曦智科技全球首创的分布式光交换技术。传统的方式无论电交换还是光交换都是中央集中式交换,而LightSphere X分布式交换可以理解为把集中式打成碎片,让每个GPU上集成光交换功能。这让超节点在调度GPU时变得非常灵活,而且可以实现故障场景下替换替补,降低GPU冗余成本。

更关键的是,这种交换方式发生在物理层,与上层的数据传输协议无关。这也使得国内各大GPU厂商都愿意跟曦智科技合作一起来构建解决方案。

除了分布式超节点方案,曦智科技还联合燧原科技推出国内首款xPU-CPO光电共封装原型系统,通过将光学引擎与计算芯片(xPU)在基板上实现光电共封装,大幅提升信号完整性并降低损耗和延迟,同时显著降低系统功耗,有效提高光电转换的稳定性。


国内首款xPU-CPO光电共封装原型系统

作为国内首次采用CPO技术实现GPU直接出光的成功案例,该项目验证了xPU-CPO光电共封装技术的可行性与技术方向,同时为中国人工智能基础设施建设与先进光学封装产业突破奠定了关键技术锚点。

曦智科技还与沐曦合作的光互连电交换超节点方案也首次公开亮相。该方案采用线性直驱光互连技术,具有低延时、高带宽、低功耗的特点,并支持长距离传输,突破跨机柜连接的限制,支持8台标准服务器共64张xPU卡的高速互连,为大模型训练及推理提供更灵活、更高效的并行策略支持,从而提升集群性能。

曦智科技创始人、CEO沈亦晨表示:“我们的芯片制程上不一样,我们没有办法继续去复制美国的技术路线,但我们在互联上会催生革命性的’交通工具’。光互联是轨道交通,电互联是公路交通。”

“我们在硅光技术上不落后,甚至我们商业落地比美国企业还要领先些。”沈亦晨表示,未来可能每个交换芯片、GPU芯片都会配数个硅光芯片,类似现在GPU边上配了一圈HBM,整个硅光的生态产业链都会受益,包括晶圆厂、光的封装厂,激光的光源,激光芯片公司等。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

直播电商的规矩,终于有人来立了

惊蛰研究所 浏览 71 09-26

罗马诺-墨索里尼:尽管我的姓氏令他人沉重,但没给我造成困扰

懂球帝 浏览 7194 07-24

北约:将考虑对俄罗斯发动“先发制人”的打击

环球网资讯 浏览 37 12-02

奇才129-126逆转雄鹿,麦科勒姆28分,KPJ空砍30分

懂球帝 浏览 32 12-02

新华社:2026世界有7大悬念 或将深刻影响国际政经格局

新华社 浏览 19 01-07

沪指3600点拉锯战,上攻动能几何?

21世纪经济报道 浏览 2572 07-24

比赛中昏厥倒地!东吴官方:胡靖已恢复意识,生命体征平稳

直播吧 浏览 9093 08-11

从车展到海外市场,成都车企跑出“全球加速度”

红星新闻 浏览 159 09-02

官方:巴黎前锋杜埃右大腿肌肉拉伤,将伤缺数周

懂球帝 浏览 32 10-31

经历家暴后离婚 50岁脱口秀新人"房主任":跟生活和解

扬子晚报 浏览 5970 07-14

上海多所高校发布AI大模型成果,涉科技伦理审查、罕见病诊断等

澎湃新闻 浏览 7772 07-27

“食安AI博士”智能体首秀进博会!

文汇报 浏览 41 11-03

H20再起停产风波:去库存还是谋新篇?

雷峰网 浏览 91 08-30

热爆了!中国机器人企业近100万家、融资超240亿

钛媒体APP 浏览 6028 08-13

微软逼你放弃本地账户!Win10 ESU必须绑定Microsoft账户:花钱也不行

快科技 浏览 1219 08-11

被指住宿环境差 广东一高校回应:没那么夸张 是误会

极目新闻 浏览 62 10-13

乐道汽车:L90不会有60度电池买断版,正研讨60度电池租赁方案

IT之家 浏览 9093 08-10

ACL首届博士论文奖揭晓!半个顶会都是中国人,超51%占比史无前例

新智元 浏览 8119 07-30

上海机场48岁总经理因个人原因辞职,上任仅9个月,去年年薪上百万元

红星资本局 浏览 57 10-26

世锦赛4×100混合泳接力:奥运冠军中国队卡9,遗憾止步无缘决赛

全景体育V 浏览 2696 08-03

不忍了!「东极岛」这一刀,狠狠反杀

吐槽电影院 浏览 4275 08-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3