关闭广告

数据“锁在家里”,AI难为无米之炊!传统开源模式失灵,更高阶“开放”在哪

文汇报2025-08-04 00:00:015802人阅读


热度空前的世界人工智能大会(WAIC)余温未散,上海再迎盛会。8月2日至3日,2025 CCF中国开源大会(以下简称“开源大会”)在沪召开。

现身此次会议的宇树科技创始人王兴兴给出一则判断:具身智能要在陌生场景中真正服务于人,需实时生成各类动作。他认为,目前,机器人整机硬件已够用,但具身智能大模型仍有巨大缺口,正“期待一个属于机器人的ChatGPT时刻”。可以说,精确数据的获取难度,也是当前具身智能机器人升级所面临的难题。

包括王兴兴在内,多位与会专家学者不约而同将讨论的热点聚焦于人工智能(AI)时代绕不开的核心话题——开源。

AI时代,开源有何重要意义?又面临哪些困境与挑战?突围之路又在何方?


AI重塑开源版图:共享协作推动技术普惠

所谓开源,就是公开代码供所有人查看、使用、修改与再分享,其“共享、协作、透明”的精神不仅影响软件领域,更延伸至教育、科研、硬件(如开源芯片)等领域,鼓励通过集体协作解决问题,推动技术普惠。

AI时代,为何开源至关重要?中国工程院院士、清华大学计算机系教授郑纬民介绍,AI大模型的生命周期一般包括五个环节,其中,数据获取、预处理与模型训练前三个环节需海量数据与算力,成本高昂,非一般公司能负担。而开源,则有望让小公司也能直接基于大公司的模型,跳过前三个环节,专注于模型微调和推理。

另一方面,AI的进步依赖 “不断试错、持续优化”。一个模型需经无数场景测试,单靠一家公司难以穷尽。所以,开源能让全球开发者共同“找茬”、协同改进。正如中国科学院院士、南京大学教授吕建所言:“开源决定规模,规模决定涌现,涌现成就颠覆。”

开源大幅降低了互联网技术的使用成本,让小公司、个人开发者得以参与到技术浪潮中,催生出更多新想法、新服务。上海交通大学校长、中国科学院院士丁奎岭也指出,开源不仅是当前全球科技创新的技术风尚,更是推动开放发展、共同发展的重要路径。


若数据不开放,AI开源就不是真正的开源

AI在持续迭代的过程中,数据尤其核心。“AI正在经历从‘模型中心’向‘数据中心’的范式转变。” 中国科学院院士、北京大学教授、上海交通大学人工智能学院首席顾问鄂维南指出,高质量、高效率的数据基础设施是降低AI落地门槛的关键。

作为人口大国,数据本是我国的优势。但在此次论坛上,多位与会的专家都提及一个共同的现实困境:一方面,数据作为企业核心资产,价值愈发被重视;另一方面,随着公众数据保护与安全意识的提升,大量数据因“安全考虑”无法公开。“我国大数据建设推进多年,却在一些领域出现了‘倒退’迹象,甚至不少数据即便收集完成、研究有了成果,落地却杳无音信。”

“所谓的AI开源,若数据不开放,就不是软件开源所定义的开源。”中国科学院院士、北京大学教授梅宏解释道,即便大模型参数公开,若外界没有相同的训练数据,也难以复现其能力,更谈不上迭代创新。当AI的核心生产资料——数据,因商业价值与安全合规问题被“锁在家里”时,传统开源模式便陷入了“无米之炊”的困境。


从“开源”到“开放”,亟需共建新生态

面对AI时代的挑战,传统开源模式渐显乏力,破题抓手在哪里?多位专家认为,当务之急是构建一个更高维的“开放”解法。

开放数据的核心是“数据资源的有条件共享”。回顾人类的数据开放史,本身就是从封闭走向分层开放的进化过程。所以,从开源到开放,并非倒退。例如,互联网早期“黄页”都主动公开电话号码,而现代隐私保护法则要求“最小必要”等原则,这不是倒退,而是数据管理的升级。

开放数据通常附带场景限制,如禁止商业滥用、需脱敏处理,且不允许修改原始数据,目的是释放数据价值以支撑AI训练与科研分析。以医疗数据为例,需去除隐私信息后开放,且仅限科研使用,不得修改原始属性。

如专家们所说,“开放更具有长远的价值”,其范畴涵盖标准、API、平台等多个维度。AI时代,开放架构(如分层接口标准化)比单纯开源代码更易推动二次创新,适配AI快速迭代需求。

中国工程院院士、中国工程院原副院长陈左宁指出,AI时代,设计精良的“开放架构”可能比完全公开的源代码更有意义。从“给代码”到“给接口、给标准、给合作框架”,将能让不同创新者在各自擅长的领域(如底层硬件适配、上层应用开发)便捷接入与贡献,大幅降低协作门槛,构建高效创新生态。

2025 CCF中国开源大会由中国计算机学会(CCF)主办、上海交通大学和CCF开源发展技术委员会承办。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海造!长征十二号火箭圆满完成第二次发射

上观新闻 浏览 1898 08-05

中国新能源汽车渗透率58.37%创历史新高

大象新闻 浏览 12 10-13

埃迪-豪:弗兰克的球队无球时很有侵略性;英联杯对我们很重要

懂球帝 浏览 7 10-29

最牛退休女工,靠卖易拉罐,纳税100亿

创业家 浏览 17 10-15

旺仔小乔被起诉!榜一大哥发函要求归还80万打赏,直言希望她坐牢

萌神木木 浏览 4997 08-02

因本菲卡有欧冠资格赛,鲁伊-科斯塔缺席若热-科斯塔的葬礼

懂球帝 浏览 6876 08-07

谢霆锋现实长什么样?路人镜头暴露真实身高,突然理解李诞了

温柔娱公子 浏览 20 10-13

巴勒斯坦球员:有需要请选择我,这是我逃离战争的唯一机会

懂球帝 浏览 16 10-09

男童参加夏令营走失 知情人:其患自闭症 很少主动交流

环球网资讯 浏览 7901 08-11

AMD 锐龙 Zen5 TR PRO 处理器和 AI PRO R9700 显卡 23 日起发售

IT之家 浏览 9885 07-18

搭五代EA888发动机的大众旗舰SUV 地表最强2.0T

汽车之家 浏览 4556 05-18

新能源乘用车零售占比近六成,燃油车8月上旬车市同比下滑4%

经济观察报 浏览 2433 08-14

长安启源全新Q05:10万级配激光雷达和小蓝灯

网易汽车 浏览 2362 08-11

兹维炮轰巴黎场地速度:太慢,弹跳忽高忽低,阿卡出局或与此有关

网球之家 浏览 0 10-31

貌美的干妈,青梅竹马的他!继承董璇颜值的小酒窝,真天选女明星

温柔娱公子 浏览 9800 08-01

日本首相之位将会花落谁家?

首席商业评论 浏览 31 09-21

马斯克开火,苹果发声

观察者网 浏览 957 08-14

快把裙子脱了!今夏流行“冰冰裤”,巨时髦巨显瘦!

Yuki女人故事 浏览 7760 06-05

分手三年不提对方,黄晓明没有给杨颖留体面?

一家说 浏览 5226 07-10

当奥迪走上“对抗路”,特斯拉开始疲于招架

车市雷达 浏览 14 10-16

万斯称美国正考虑向乌克兰提供“战斧”导弹

央视新闻客户端 浏览 39 09-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3