关闭广告

大模型走到十字路口,未来机会在哪?

封面新闻2025-07-28 00:00:028005人阅读

封面新闻记者 边雪 上海报道

站在十字路口的大模型,既需仰望星空的大胆设想,也离不开脚踏实地的智慧。7月26日,一场聚焦大模型技术路线、数据瓶颈与商业落地的圆桌对话,引发业界高度关注。


在商汤承办的2025WAIC大模型论坛上,商汤科技联合创始人林达华、阶跃星辰首席科学家张祥雨,上海人工智能实验室青年领军科学家、书生大模型负责人陈恺,北京智谱华章科技股份有限公司总裁王绍兰,范式集团联合创始人、首席科学家陈雨强及英伟达全球开发者生态副总裁Neil Trevett,围绕大模型发展至关键十字路口的现状,他们从技术路线抉择、数据瓶颈突破与商业落地路径三大维度,展开了一场关乎AI未来命运的深度思辨。

模型如何像人一样自主探索?

“我们所知的预训练将终结。” 林达华在讨论伊始,就援引了OpenAI前首席科学家Ilya Sutskever在NeurIPS 2024上的论断,直指行业范式迁移——从“预训练+监督微调”走向“强化学习驱动推理”。

“强化学习让模型第一次拥有了‘带反思的思维链’,解决了仅靠压缩语料无法完成的因果推理难题。”阶跃星辰首席科学家张祥雨表示,预训练本质是行为克隆(Behavior Cloning),其固有缺陷无法通过扩大数据或模型解决。

张祥雨进一步预测,下一阶段强化学习将接受自然语言反馈,实现“Test-Time Training”,让模型像人一样在真实环境中自主探索。

上海AI实验室陈恺则揭示了强化学习发展的前置条件:“强化学习大放异彩的背后,恰恰印证了预训练的重要性。RL极度依赖高质量的‘冷启动模型’作为探索基础。”他更警示当前RL面临两大瓶颈:确定性奖励局限(仅适用于数学编程等封闭问题)与基础设施挑战(探索学习需消耗海量算力)。

封面新闻记者在会上注意到,Transformer架构革新也面临“暗流涌动”。当讨论深入到模型架构时,张祥雨抛出“传统Transformer已到瓶颈”的判断。他认为,在即将到来的“智能体时代”,模型需具备“无限上下文”能力,而Transformer的串行生成机制难以胜任。

“RNN类结构会在两年内重回主流,但需要引入深层到浅层的反向交互,以支持持续学习。”张祥雨直言。

“互联网数据枯竭是量的问题,但更致命的是质的问题。”王绍兰认为,基座模型相当于通识教育毕业生,行业落地则需“企业入职培训”——通过行业数据预训练结合RL对齐,使模型掌握专属知识。

“这正是垂类公司的生存壁垒,”王绍兰强调:“当企业拥有独有行业数据和RL训练能力,就无需畏惧基座模型的碾压。”

数据短缺如何破解?

数据枯竭,被视为横亘在AGI面前的“最后一道墙”。

“数据短缺将成为一个关键难题,尤其是对于那些无法获取、成本高昂、不道德、危险或涉及隐私的数据。”Neil Trevett在圆桌中首次系统阐释了英伟达的破局思路:“填补这一缺口的方法之一,就是利用物理仿真来生成模拟场景,用于训练大语言模型。”

“英伟达在机器人和自动驾驶领域长期深耕,通过Cosmos世界基础模型,能够生成极为逼真的场景,从而获得可用于训练的真实世界数据。”Neil Trevett表示,这些数据通常精确且已标注,非常适合训练,尤其擅长生成那些罕见或极端案例——例如车祸,或机器人遭遇异常状况——这些场景在现实世界中几乎无法采集或难以复现。

“但是,我们不能完全依赖这类合成数据。合成数据不可避免地会存在缺陷、误差和偏差,因此我们必须建立反馈闭环:通过真实世界的基准测试与验证来持续校准训练过程,也许需要人工介入。”Neil Trevett直言,目前,许多相关技术正在开发中。“未来,我们将看到一种强大的混合流程:结合自监督学习,以最大限度减少所需数据量;引入主动学习,让训练系统自主识别最有价值的场景进行训练;仅在绝对必要时,通过人工验证与纠偏,确保训练过程始终紧贴现实,从而避免模型崩溃。”

Neil Trevett也提醒到,合成数据不能包打天下,“必须建立真实世界的反馈闭环,用人在回路持续校准,避免模型崩溃”。他预测,行业将走向“自监督+主动学习+人类验证”的混合管线,从而把数据需求压到最低。

智谱华章总裁王绍兰用“大学生和师傅”的比喻形容产业分工:基座模型如同大学毕业的通才,企业用行业知识库做“二轮预训练”,再用强化学习配“师傅带教”,才能解决真实业务问题。“行业数据既是模型精调的燃料,也是垂类公司最深的护城河。”他呼吁各行业成立数据联盟,把非敏感行业语料共享出来,形成正向循环。

陈雨强则从金融反欺诈案例指出,高敏感场景甚至需要“独立训练”基座模型,企业当务之急是建立统一的开源/闭源模型调度平台,以最快速度吸收前沿能力,同时保护私有数据。

开源仍是“最大鲶鱼” ?

面对“开源是否会削弱商业模型竞争力”的尖锐提问,陈恺直言,开源不会做出最顶尖模型,但能逼迫所有玩家把资源投入到真正差异化的环节,“若闭源模型无法超越开源,就失去存在意义。”

站在产业视角,Neil Trevett直言:开源力量“不可否认”,但每家公司需自行权衡开源带来的成本节省与商业优势流失,“未来不会是非黑即白,而是开放权重、部分闭源和混合架构的长期共存”。他提出混合架构设想——部分组件开源推动生态,核心模块闭源保护商业。

人工智能已不再是单一公司或单一技术的竞赛,而是全人类共同构建AGI生态的伟大协作。随着WAIC 2025的议程推进,这些前沿思考将在实验室、机房与千行百业中加速落地,推动通用人工智能从“下一代”走向“这一代”。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小伙河滩游玩坠2米深疑似砂坑 获救后几近失明智力下降

极目新闻 浏览 1385 07-29

全系搭载3颗图灵AI芯片,全新小鹏P7正式亮相

光子星球 浏览 3427 08-07

瑞虎9黑武士版正式上市 售价15.59万元

车印记 浏览 6046 05-29

中金公司董事长:我国人工智能正加快实现跨越式发展,海内外市场对中国资产潜力进行了重估

澎湃新闻 浏览 2659 07-28

与特朗普会晤前夕 内塔尼亚胡收到"机密备忘录"警告

环球网资讯 浏览 18 09-30

金山云(KC.US)携6大AI创新成果亮相WAIC

智通财经 浏览 9651 07-27

620亿泉州家族企业,吞并飞利浦照明资产

21财闻汇 浏览 4775 08-07

特朗普报复印度加税50% 话音刚落莫迪宣布将来华面谈

掌青说历史 浏览 679 08-07

"朱雀玄武敕令"自称被送精神病院并限制自由 医院回应

大风新闻 浏览 10003 07-28

美拉德+黑蓝白,太好看了!

Yuki女人故事 浏览 28 09-25

终于认怂!52岁郭德纲卑微催婚儿子郭麒麟:横了一辈子,也有今天

温柔娱公子 浏览 6683 08-18

“撒钱”撒出千亿市值公司,影石创新再次狂飙,已有7家公募抢筹

YOUNG财经 浏览 4580 08-19

高市早苗当选日本首相 成为日本历史上首名女首相

环球网 浏览 11 10-22

成本仅5000万,预售冲上第三,邓超加黄渤都压不住,年度黑马来了

靠谱电影君 浏览 25 09-26

意媒:国米有意凯塔和弗伦德鲁普,阿根廷的埃泽也被推荐给国米

懂球帝 浏览 3616 08-12

美新一代"末日飞机"亮相:总统可指挥核导弹部队反击

环球时报国际 浏览 6402 08-11

特朗普要“夺回”华盛顿?

国际金融报 浏览 6087 08-13

上海一博物馆循环播放"熊孩子"损坏展品视频 馆方回应

上游新闻 浏览 2073 07-25

里尔总监:即使帕瓦尔愿意回归,我们也无力承担转会费

直播吧 浏览 50 08-23

即将开源!华为发布AI推理黑科技,已在中国银联落地

钛媒体APP 浏览 4519 08-13

谷歌 Pixel 10 Pro Fold 折叠屏手机官方渲染图公布:告别黑白

IT之家 浏览 5659 07-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3