关闭广告

数据“锁在家里”,AI难为无米之炊!传统开源模式失灵,更高阶“开放”在哪

文汇报2025-08-04 00:00:015767人阅读


热度空前的世界人工智能大会(WAIC)余温未散,上海再迎盛会。8月2日至3日,2025 CCF中国开源大会(以下简称“开源大会”)在沪召开。

现身此次会议的宇树科技创始人王兴兴给出一则判断:具身智能要在陌生场景中真正服务于人,需实时生成各类动作。他认为,目前,机器人整机硬件已够用,但具身智能大模型仍有巨大缺口,正“期待一个属于机器人的ChatGPT时刻”。可以说,精确数据的获取难度,也是当前具身智能机器人升级所面临的难题。

包括王兴兴在内,多位与会专家学者不约而同将讨论的热点聚焦于人工智能(AI)时代绕不开的核心话题——开源。

AI时代,开源有何重要意义?又面临哪些困境与挑战?突围之路又在何方?


AI重塑开源版图:共享协作推动技术普惠

所谓开源,就是公开代码供所有人查看、使用、修改与再分享,其“共享、协作、透明”的精神不仅影响软件领域,更延伸至教育、科研、硬件(如开源芯片)等领域,鼓励通过集体协作解决问题,推动技术普惠。

AI时代,为何开源至关重要?中国工程院院士、清华大学计算机系教授郑纬民介绍,AI大模型的生命周期一般包括五个环节,其中,数据获取、预处理与模型训练前三个环节需海量数据与算力,成本高昂,非一般公司能负担。而开源,则有望让小公司也能直接基于大公司的模型,跳过前三个环节,专注于模型微调和推理。

另一方面,AI的进步依赖 “不断试错、持续优化”。一个模型需经无数场景测试,单靠一家公司难以穷尽。所以,开源能让全球开发者共同“找茬”、协同改进。正如中国科学院院士、南京大学教授吕建所言:“开源决定规模,规模决定涌现,涌现成就颠覆。”

开源大幅降低了互联网技术的使用成本,让小公司、个人开发者得以参与到技术浪潮中,催生出更多新想法、新服务。上海交通大学校长、中国科学院院士丁奎岭也指出,开源不仅是当前全球科技创新的技术风尚,更是推动开放发展、共同发展的重要路径。


若数据不开放,AI开源就不是真正的开源

AI在持续迭代的过程中,数据尤其核心。“AI正在经历从‘模型中心’向‘数据中心’的范式转变。” 中国科学院院士、北京大学教授、上海交通大学人工智能学院首席顾问鄂维南指出,高质量、高效率的数据基础设施是降低AI落地门槛的关键。

作为人口大国,数据本是我国的优势。但在此次论坛上,多位与会的专家都提及一个共同的现实困境:一方面,数据作为企业核心资产,价值愈发被重视;另一方面,随着公众数据保护与安全意识的提升,大量数据因“安全考虑”无法公开。“我国大数据建设推进多年,却在一些领域出现了‘倒退’迹象,甚至不少数据即便收集完成、研究有了成果,落地却杳无音信。”

“所谓的AI开源,若数据不开放,就不是软件开源所定义的开源。”中国科学院院士、北京大学教授梅宏解释道,即便大模型参数公开,若外界没有相同的训练数据,也难以复现其能力,更谈不上迭代创新。当AI的核心生产资料——数据,因商业价值与安全合规问题被“锁在家里”时,传统开源模式便陷入了“无米之炊”的困境。


从“开源”到“开放”,亟需共建新生态

面对AI时代的挑战,传统开源模式渐显乏力,破题抓手在哪里?多位专家认为,当务之急是构建一个更高维的“开放”解法。

开放数据的核心是“数据资源的有条件共享”。回顾人类的数据开放史,本身就是从封闭走向分层开放的进化过程。所以,从开源到开放,并非倒退。例如,互联网早期“黄页”都主动公开电话号码,而现代隐私保护法则要求“最小必要”等原则,这不是倒退,而是数据管理的升级。

开放数据通常附带场景限制,如禁止商业滥用、需脱敏处理,且不允许修改原始数据,目的是释放数据价值以支撑AI训练与科研分析。以医疗数据为例,需去除隐私信息后开放,且仅限科研使用,不得修改原始属性。

如专家们所说,“开放更具有长远的价值”,其范畴涵盖标准、API、平台等多个维度。AI时代,开放架构(如分层接口标准化)比单纯开源代码更易推动二次创新,适配AI快速迭代需求。

中国工程院院士、中国工程院原副院长陈左宁指出,AI时代,设计精良的“开放架构”可能比完全公开的源代码更有意义。从“给代码”到“给接口、给标准、给合作框架”,将能让不同创新者在各自擅长的领域(如底层硬件适配、上层应用开发)便捷接入与贡献,大幅降低协作门槛,构建高效创新生态。

2025 CCF中国开源大会由中国计算机学会(CCF)主办、上海交通大学和CCF开源发展技术委员会承办。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

葡媒:为制造惊喜,波尔图让吕克-德容以手球球员的身份体检

懂球帝 浏览 7844 08-05

亚洲杯-黎巴嫩男篮大胜日本进八强将战新西兰 新疆外援劳森24+10

醉卧浮生 浏览 8540 08-13

充电宝“地震”2月后,安克创新赴港“续命”!

野马财经 浏览 6257 08-21

继续保留燃油版 新款保时捷Cayenne谍照曝光

车质网 浏览 2015 05-22

图片报:多特有意鲍勃等球员,但英超球队越来越不愿意卖人给他们

直播吧 浏览 8544 07-22

1600亿,甘肃夫妻要IPO了

投资家 浏览 2690 08-06

马斯克xAI官宣:Grok 4向全球所有用户免费开放!

智东西 浏览 4917 08-11

经纪公司官方声明:徐杰出轨赌球等均是造谣 将采取法律途径处理

醉卧浮生 浏览 5081 08-11

农村男孩高考689分进入清华大学:我就是"小镇做题家"

澎湃新闻 浏览 15 08-24

AR-HUD+800V 全新零跑C11售14.98万起

网易汽车 浏览 6845 07-12

能歪头卖萌跳齐舞!成都造“镋钯”机器人将亮相成都世运赛场

红星新闻 浏览 9499 07-22

标普纳指齐逼历史高位 “七巨头“财报将定调美股走向

智通财经 浏览 6637 07-21

ChatGPT周活用户将飙破7亿,日处理30亿条消息

网易科技报道 浏览 2706 08-05

回购10年,它真的值得

黎贝卡的异想世界 浏览 5449 05-25

“旺仔小乔”被曝用替身,疑存在多人分工模式

观察鉴娱 浏览 8364 07-31

马竞新援鲁杰里:我非常期待能和格列兹曼、小蜘蛛等队友一起踢球

直播吧 浏览 7556 07-21

大S雕像迟迟没落成,言承旭只能到墓园祭拜,当场落泪吃饭都在哭

萌神木木 浏览 7308 08-15

全网劝离大集合,从黄圣依、黄晓明到董璇

爱吃冰棍的小痞子 浏览 16 08-22

德天空:切尔西对西蒙斯有确切兴趣,莱比锡现实的要价为7000万欧

直播吧 浏览 4912 07-22

解读阿维塔06"去奢化"新豪华:不堆料也有高级感?

AutoBusiness 浏览 5393 06-23

离开组织部后,他变得客气了很多……

识局 浏览 3853 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3