关闭广告

数据“锁在家里”,AI难为无米之炊!传统开源模式失灵,更高阶“开放”在哪

文汇报2025-08-04 00:00:015921人阅读


热度空前的世界人工智能大会(WAIC)余温未散,上海再迎盛会。8月2日至3日,2025 CCF中国开源大会(以下简称“开源大会”)在沪召开。

现身此次会议的宇树科技创始人王兴兴给出一则判断:具身智能要在陌生场景中真正服务于人,需实时生成各类动作。他认为,目前,机器人整机硬件已够用,但具身智能大模型仍有巨大缺口,正“期待一个属于机器人的ChatGPT时刻”。可以说,精确数据的获取难度,也是当前具身智能机器人升级所面临的难题。

包括王兴兴在内,多位与会专家学者不约而同将讨论的热点聚焦于人工智能(AI)时代绕不开的核心话题——开源。

AI时代,开源有何重要意义?又面临哪些困境与挑战?突围之路又在何方?


AI重塑开源版图:共享协作推动技术普惠

所谓开源,就是公开代码供所有人查看、使用、修改与再分享,其“共享、协作、透明”的精神不仅影响软件领域,更延伸至教育、科研、硬件(如开源芯片)等领域,鼓励通过集体协作解决问题,推动技术普惠。

AI时代,为何开源至关重要?中国工程院院士、清华大学计算机系教授郑纬民介绍,AI大模型的生命周期一般包括五个环节,其中,数据获取、预处理与模型训练前三个环节需海量数据与算力,成本高昂,非一般公司能负担。而开源,则有望让小公司也能直接基于大公司的模型,跳过前三个环节,专注于模型微调和推理。

另一方面,AI的进步依赖 “不断试错、持续优化”。一个模型需经无数场景测试,单靠一家公司难以穷尽。所以,开源能让全球开发者共同“找茬”、协同改进。正如中国科学院院士、南京大学教授吕建所言:“开源决定规模,规模决定涌现,涌现成就颠覆。”

开源大幅降低了互联网技术的使用成本,让小公司、个人开发者得以参与到技术浪潮中,催生出更多新想法、新服务。上海交通大学校长、中国科学院院士丁奎岭也指出,开源不仅是当前全球科技创新的技术风尚,更是推动开放发展、共同发展的重要路径。


若数据不开放,AI开源就不是真正的开源

AI在持续迭代的过程中,数据尤其核心。“AI正在经历从‘模型中心’向‘数据中心’的范式转变。” 中国科学院院士、北京大学教授、上海交通大学人工智能学院首席顾问鄂维南指出,高质量、高效率的数据基础设施是降低AI落地门槛的关键。

作为人口大国,数据本是我国的优势。但在此次论坛上,多位与会的专家都提及一个共同的现实困境:一方面,数据作为企业核心资产,价值愈发被重视;另一方面,随着公众数据保护与安全意识的提升,大量数据因“安全考虑”无法公开。“我国大数据建设推进多年,却在一些领域出现了‘倒退’迹象,甚至不少数据即便收集完成、研究有了成果,落地却杳无音信。”

“所谓的AI开源,若数据不开放,就不是软件开源所定义的开源。”中国科学院院士、北京大学教授梅宏解释道,即便大模型参数公开,若外界没有相同的训练数据,也难以复现其能力,更谈不上迭代创新。当AI的核心生产资料——数据,因商业价值与安全合规问题被“锁在家里”时,传统开源模式便陷入了“无米之炊”的困境。


从“开源”到“开放”,亟需共建新生态

面对AI时代的挑战,传统开源模式渐显乏力,破题抓手在哪里?多位专家认为,当务之急是构建一个更高维的“开放”解法。

开放数据的核心是“数据资源的有条件共享”。回顾人类的数据开放史,本身就是从封闭走向分层开放的进化过程。所以,从开源到开放,并非倒退。例如,互联网早期“黄页”都主动公开电话号码,而现代隐私保护法则要求“最小必要”等原则,这不是倒退,而是数据管理的升级。

开放数据通常附带场景限制,如禁止商业滥用、需脱敏处理,且不允许修改原始数据,目的是释放数据价值以支撑AI训练与科研分析。以医疗数据为例,需去除隐私信息后开放,且仅限科研使用,不得修改原始属性。

如专家们所说,“开放更具有长远的价值”,其范畴涵盖标准、API、平台等多个维度。AI时代,开放架构(如分层接口标准化)比单纯开源代码更易推动二次创新,适配AI快速迭代需求。

中国工程院院士、中国工程院原副院长陈左宁指出,AI时代,设计精良的“开放架构”可能比完全公开的源代码更有意义。从“给代码”到“给接口、给标准、给合作框架”,将能让不同创新者在各自擅长的领域(如底层硬件适配、上层应用开发)便捷接入与贡献,大幅降低协作门槛,构建高效创新生态。

2025 CCF中国开源大会由中国计算机学会(CCF)主办、上海交通大学和CCF开源发展技术委员会承办。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苗圃没想到,差点和自己结婚的罗晋 早已变成这样

小杨侃事 浏览 137 08-29

算力供给侧大模型实际应用有何优势与局限?这场沙龙集思广益

澎湃新闻 浏览 183 08-23

女子说"死了一晚上死了吗"男友跳车身亡 被判赔21万多

南方都市报 浏览 248 09-02

人均100吃出上千仪式感!“板前模式”爆发了

餐饮老板内参 浏览 6345 07-28

20万手术费赎不回身陷缅甸的儿子 患癌母亲哭瞎左眼

封面新闻 浏览 215 08-22

一箭双雕!拉什福德实现儿萨梦,接过偶像亨利的14号球衣

直播吧 浏览 982 07-24

官方:罗马签下18岁尤文门将热莱兹尼,他将身披91号球衣

懂球帝 浏览 7440 07-24

“中国战狼”到“京学被嘲”?互联网解构吴京

桑葚爱动画 浏览 131 09-20

首款陪伴型机器人亮相!傅利叶加速布局康养赛道,创始人坦言走入家庭还需很长时间|聚焦2025WRC

华夏时报 浏览 6665 08-10

搭载华为辅助驾驶 岚图追光L谍照曝光

车质网 浏览 9783 08-05

娜娜的白背心,沈萍的录像带,《扫毒风暴》这么拍,让我头皮发麻

娱乐圈笔娱君 浏览 7360 07-18

牛市来了?

智本社 浏览 8910 07-30

儿子车祸过世后 上海阿姨精神异常每天在小区里骂人

环球网资讯 浏览 201 08-25

国安时隔7年重返足协杯半决赛,2018年杀入决赛最终夺冠

懂球帝 浏览 6473 07-23

德米纳尔救赛点夺第十冠,90后冠军数排行榜上能列第几?

网球之家 浏览 6269 07-30

上海交大突破:AI精准学习人类审美偏好

科技行者 浏览 116 11-09

但斌年中路演观点总结出炉!22个问答揭秘下半年投资机会!

私募排排网 浏览 2156 07-28

加沙城民众生计仍然艰难 天气与蚊虫也成威胁

极目新闻 浏览 99 10-26

2025年热销的十款新能源车 卖得好真不是靠吹牛?

汽车天涯 浏览 85 01-17

机构致歉:“北京燃油车彻底禁入网约平台”信息未经核实造成误导

网易财经 浏览 1425 07-23

谁是中国第一吐槽役?

仙女事件簿 浏览 149 10-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3