关闭广告

大模型走到十字路口,未来机会在哪?

封面新闻2025-07-28 00:00:028006人阅读

封面新闻记者 边雪 上海报道

站在十字路口的大模型,既需仰望星空的大胆设想,也离不开脚踏实地的智慧。7月26日,一场聚焦大模型技术路线、数据瓶颈与商业落地的圆桌对话,引发业界高度关注。


在商汤承办的2025WAIC大模型论坛上,商汤科技联合创始人林达华、阶跃星辰首席科学家张祥雨,上海人工智能实验室青年领军科学家、书生大模型负责人陈恺,北京智谱华章科技股份有限公司总裁王绍兰,范式集团联合创始人、首席科学家陈雨强及英伟达全球开发者生态副总裁Neil Trevett,围绕大模型发展至关键十字路口的现状,他们从技术路线抉择、数据瓶颈突破与商业落地路径三大维度,展开了一场关乎AI未来命运的深度思辨。

模型如何像人一样自主探索?

“我们所知的预训练将终结。” 林达华在讨论伊始,就援引了OpenAI前首席科学家Ilya Sutskever在NeurIPS 2024上的论断,直指行业范式迁移——从“预训练+监督微调”走向“强化学习驱动推理”。

“强化学习让模型第一次拥有了‘带反思的思维链’,解决了仅靠压缩语料无法完成的因果推理难题。”阶跃星辰首席科学家张祥雨表示,预训练本质是行为克隆(Behavior Cloning),其固有缺陷无法通过扩大数据或模型解决。

张祥雨进一步预测,下一阶段强化学习将接受自然语言反馈,实现“Test-Time Training”,让模型像人一样在真实环境中自主探索。

上海AI实验室陈恺则揭示了强化学习发展的前置条件:“强化学习大放异彩的背后,恰恰印证了预训练的重要性。RL极度依赖高质量的‘冷启动模型’作为探索基础。”他更警示当前RL面临两大瓶颈:确定性奖励局限(仅适用于数学编程等封闭问题)与基础设施挑战(探索学习需消耗海量算力)。

封面新闻记者在会上注意到,Transformer架构革新也面临“暗流涌动”。当讨论深入到模型架构时,张祥雨抛出“传统Transformer已到瓶颈”的判断。他认为,在即将到来的“智能体时代”,模型需具备“无限上下文”能力,而Transformer的串行生成机制难以胜任。

“RNN类结构会在两年内重回主流,但需要引入深层到浅层的反向交互,以支持持续学习。”张祥雨直言。

“互联网数据枯竭是量的问题,但更致命的是质的问题。”王绍兰认为,基座模型相当于通识教育毕业生,行业落地则需“企业入职培训”——通过行业数据预训练结合RL对齐,使模型掌握专属知识。

“这正是垂类公司的生存壁垒,”王绍兰强调:“当企业拥有独有行业数据和RL训练能力,就无需畏惧基座模型的碾压。”

数据短缺如何破解?

数据枯竭,被视为横亘在AGI面前的“最后一道墙”。

“数据短缺将成为一个关键难题,尤其是对于那些无法获取、成本高昂、不道德、危险或涉及隐私的数据。”Neil Trevett在圆桌中首次系统阐释了英伟达的破局思路:“填补这一缺口的方法之一,就是利用物理仿真来生成模拟场景,用于训练大语言模型。”

“英伟达在机器人和自动驾驶领域长期深耕,通过Cosmos世界基础模型,能够生成极为逼真的场景,从而获得可用于训练的真实世界数据。”Neil Trevett表示,这些数据通常精确且已标注,非常适合训练,尤其擅长生成那些罕见或极端案例——例如车祸,或机器人遭遇异常状况——这些场景在现实世界中几乎无法采集或难以复现。

“但是,我们不能完全依赖这类合成数据。合成数据不可避免地会存在缺陷、误差和偏差,因此我们必须建立反馈闭环:通过真实世界的基准测试与验证来持续校准训练过程,也许需要人工介入。”Neil Trevett直言,目前,许多相关技术正在开发中。“未来,我们将看到一种强大的混合流程:结合自监督学习,以最大限度减少所需数据量;引入主动学习,让训练系统自主识别最有价值的场景进行训练;仅在绝对必要时,通过人工验证与纠偏,确保训练过程始终紧贴现实,从而避免模型崩溃。”

Neil Trevett也提醒到,合成数据不能包打天下,“必须建立真实世界的反馈闭环,用人在回路持续校准,避免模型崩溃”。他预测,行业将走向“自监督+主动学习+人类验证”的混合管线,从而把数据需求压到最低。

智谱华章总裁王绍兰用“大学生和师傅”的比喻形容产业分工:基座模型如同大学毕业的通才,企业用行业知识库做“二轮预训练”,再用强化学习配“师傅带教”,才能解决真实业务问题。“行业数据既是模型精调的燃料,也是垂类公司最深的护城河。”他呼吁各行业成立数据联盟,把非敏感行业语料共享出来,形成正向循环。

陈雨强则从金融反欺诈案例指出,高敏感场景甚至需要“独立训练”基座模型,企业当务之急是建立统一的开源/闭源模型调度平台,以最快速度吸收前沿能力,同时保护私有数据。

开源仍是“最大鲶鱼” ?

面对“开源是否会削弱商业模型竞争力”的尖锐提问,陈恺直言,开源不会做出最顶尖模型,但能逼迫所有玩家把资源投入到真正差异化的环节,“若闭源模型无法超越开源,就失去存在意义。”

站在产业视角,Neil Trevett直言:开源力量“不可否认”,但每家公司需自行权衡开源带来的成本节省与商业优势流失,“未来不会是非黑即白,而是开放权重、部分闭源和混合架构的长期共存”。他提出混合架构设想——部分组件开源推动生态,核心模块闭源保护商业。

人工智能已不再是单一公司或单一技术的竞赛,而是全人类共同构建AGI生态的伟大协作。随着WAIC 2025的议程推进,这些前沿思考将在实验室、机房与千行百业中加速落地,推动通用人工智能从“下一代”走向“这一代”。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

比亚迪方程豹钛7高配版来了

大象新闻 浏览 2891 07-18

沙奇里:很享受在拜仁的时光也不后悔离开;我和渣叔关系很好

懂球帝 浏览 4653 07-27

泡泡玛特比Gucci赚钱|氪金·大事件

36氪财经 浏览 3357 08-21

清华学霸,突破卡脖子,一人干出两家千亿级芯片巨头

华商韬略 浏览 7742 07-24

双节假日即将拉开序幕:酒店民宿预订率均超去年,第一批拼假游客已抵达酒店

澎湃新闻 浏览 27 09-29

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 34 09-26

特朗普与柬埔寨和泰国领导人通电话 柬泰均同意停火

央视新闻客户端 浏览 5041 07-28

加斯佩里尼:希望罗马德比精彩激烈但没有暴力,我和萨里相互尊重

直播吧 浏览 27 09-20

上海德比激烈冲突!特谢拉怒斥茹萨,马宁入场弹压,颜骏凌暴怒

奥拜尔 浏览 7832 08-10

《生万物》演技排名:杨幂逆袭,倪大红让人失望

影像温度 浏览 40 08-25

王欣瑜独抗本赛季金花大旗?硬地战高芙难度超草地

体坛周报 浏览 2005 08-11

星链再遇大规模网络中断 加剧系统可靠性担忧

财联社 浏览 8405 08-19

保时捷再推一款"王炸车型"!内饰"四块"大屏 你受得了?

网上车市 浏览 4322 07-08

战满5局惜败!世界第一林诗栋2-3邱党,无缘横滨冠军赛八强

全景体育V 浏览 6402 08-09

低调的潮汕,藏着一个500亿隐形玩具帝国

快刀财经 浏览 43 08-25

梓渝又翻车!正宫2号说他约P共同好友

ETtoday星光云 浏览 3279 07-25

韩红发文暴露孙燕姿真实人品,整个娱乐圈沉默了

素衣读史 浏览 5107 07-18

"特普会"机密文件被酒店打印机泄露 涉多项敏感细节

环球网资讯 浏览 1032 08-17

新车扎堆,如何让购车价值最大化?

天天汽车 浏览 21 10-06

女子100米蛙泳决赛:卫冕冠军唐钱婷收获铜牌 德国选手埃伦特夺冠

直播吧 浏览 7252 07-30

他入行30年不温不火,回村务农却火了

艳儿说电影 浏览 3 10-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3