关闭广告

AI如何赋能生命科学:用“万能函数”表征生命

澎湃新闻2025-07-29 12:00:012712人阅读

·要让AI在这个问题上有“用武之地”,还需要科学家在数据、算法等方面做大量的调整和创新工作。

生命是宇宙中最精妙复杂的系统。从一个细胞分裂增殖到37万亿细胞协同构建成一个完整的人体,其背后蕴藏的信息与规律浩如烟海。面对指数级增长的生物大数据和高度动态与非线性的生命过程,人工智能(AI)技术有望帮助科学家探寻其中的规律。

7月28日,在上海举行的世界人工智能大会(WAIC)“AI赋能生命科学论坛”上,来自中国科学院等机构的多名顶尖学者齐聚一堂,共同探讨了如何利用人工智能(AI)这一强大引擎,将离散、高维的生物数据转化为可理解、可预测、甚至可调控的生命模型。

用AI“万能函数”绘制生命地图

对自然世界进行数理建模往往要求科学家首先理解系统背后的物理或化学原理,再用微分方程等工具进行描述。以神经网络算法为基础的AI模型则提供了另一种表征自然的方式:它不预设具体的规律,而是通过学习海量数据,自动发现其中隐藏的高维、非线性关联。中国科学院分子细胞科学卓越创新中心研究员、上海交通大学讲席教授陈洛南将其形容为一个“万能函数”。

生命科学的一个首要问题是构建静态表征,即为复杂的生命系统在特定时刻拍摄一张超高分辨率的“快照”,揭示基因如何调控、蛋白质如何相互作用、细胞如何互动等等过程。要让AI在这个问题上有“用武之地”,还需要科学家在数据、算法等方面做大量的调整和创新工作。

“所有的AI for life science(AI赋能生命科学),基石就是大数据。” 中国科学院院士李劲松说。大数据并不仅仅意味着“多”,统一标准、高质量的数据才是AI模型能够“洞察真相”的前提。

生命科学的核心遵循着一个“中心法则”:DNA储存遗传蓝图,通过转录形成信使RNA,再由RNA指导蛋白质的合成。蛋白质作为生命活动最主要的功能执行者,其种类、数量、位置和相互作用,决定了细胞的命运乃至整个机体的健康与疾病。李劲松院士团队提出的“基因组标签计划”(GTP),通过“类精子干细胞”技术,为小鼠所有2万多个编码蛋白质的基因逐一打上“标签”,用一个统一的框架来追踪动物实验中蛋白质发生的变化。

“未来所有这些蛋白质的研究,就可以用一个抗体的标准化研究体系来搞定,”李劲松将其比喻为生命科学研究的“北斗导航系统”。在这个系统中,每一个蛋白质都被精准“定位”,为后续所有AI分析提供了前所未有的标准化高质量数据基础。

有了标准化的数据,AI便能大显身手,绘制出更精细的“地图”。中国科学院动物研究所的李鑫研究员展示了如何构建“AI虚拟细胞”。他们将海量单细胞数据“喂”给AI,让模型学习细胞的“语言”。“我们把每个细胞的基因表达当成一篇文章,通过自回归的遮蔽训练去完成建模,”李鑫解释道。这好比让AI阅读了数百万篇描述细胞状态的“文章”后,学会了精准表征每一个细胞的状态。

AI能从人类难以理解的信息中“看”出规律。西安交通大学教授叶凯提出一种AI数据分析策略,将一维的基因组序列信息“升维”成二维的图像,使得原本适用于图像识别的强大AI算法(如卷积神经网络)可以直接用于分析基因组,从而在复杂的基因组结构变异检测中,捕捉到传统方法难以发现的模式。

由静到动

生命并非静止的图景,而是一部时刻演进的电影。如何从一张张“快照”中,解读出生命过程的动态规律,是AI赋能生命科学的另一个突破点。然而,AI模型虽然“万能”,虽然能输出正确的结果,但其内部复杂的参数也使其成为难以解读的“黑箱”。

要通过AI模型理解生命,就需要将它从“黑箱子变成一个白箱子”。为此,陈洛南团队提出了“时空信息转换”(STI)理论。该理论从数学上证明,一个高维度的空间状态(静态快照)可以在特定条件下映射为一个低维度的时间序列(动态电影)。这意味着,AI无需看到整个过程,仅通过分析高质量的静态数据,就有可能推演出其背后的动态演化规律。

不同于DNA,目前RNA的结构跟功能的真实测量数据还比较缺乏。深势科技研发负责人、北京科学智能研究院研究员温翰介绍了在相关理论的基础上构建的通用RNA预训练模型,通过AI模型加入“先验”知识结构和算法创新,不仅提高了在少量训练数据基础上预测RNA结构的准确性,更能模拟其在细胞内的动态行为,如调控翻译效率和稳定性。

中国科学技术大学教授刘海燕也指出,蛋白质的功能源于其动态变化。AlphaFold解决了蛋白质的静态“折叠”问题,但要设计出真正有功能的“分子机器”,就必须理解其动态过程。他的团队正致力于通过AI模型,预测蛋白质的动态学特性,甚至设计出能在不同状态间切换的复杂功能蛋白。

导航生命,干预疾病

如果AI能够理解并预测生命的“动态电影”,那么终极目标便是成为一名“导演”,对生命过程进行智能导航与干预。

陈洛南认为,疾病的发生并非一蹴而就,而是从正常状态,经过一个难以察觉的“临界态”,最终才滑向不可逆的疾病状态。他的团队开发了能够根据患者健康数据识别出这个“临界点”的AI模型,实现“治未病”的精准导航。

浙江省肿瘤医院的程向东分享了其团队利用AI进行胃癌早筛的成果。他们训练AI模型通过解读腹部CT平扫图像来发现早期胃癌。他们的模型能将需要做胃镜检查的高危人群从25%浓缩到6.2%,极大地提升了早期诊断的效率。

AI的“导航”能力不仅体现在“避开悬崖”,更体现在“开辟新路”。中国科学院微生物研究所研究员王军介绍了利用AI语言模型在浩瀚的微生物基因组中挖掘具有特定功能的“功能多肽”的研究成果。他的团队甚至能“无中生有”,设计出自然界不存在、但能让工业菌株生长速度提升30%的全新多肽。这如同为生命系统编写了新的“程序代码”,主动引导其走向我们期望的方向。

多名学者提到,AI不仅正在加速知识的发现,更在创造全新的研究范式,但它在生命科学中的应用仍面对多重挑战。首先是数据鸿沟,李劲松指出,高质量、标准化的数据仍是稀缺资源。其次是可解释性瓶颈,AI的“黑箱”本质意味着学者仍需关注科学研究的可解释性。最后是从虚拟到现实的鸿沟。刘海燕指出,AI设计的分子或细胞能否在真实世界中稳定存在并发挥作用,仍需大量的实验验证。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

京东AI爆发:“狂扫”机器人赛道后,官宣与数十家机器人品牌达成合作

时代财经 浏览 5234 07-29

于根伟:客场对阵海港必须要保持很好的防守,我觉得球员做的不错

直播吧 浏览 36 08-25

球员合同不应被公开?美记:欧文应该对经纪人说 他们透露的金额

直播吧 浏览 1025 07-23

石破茂:日本面临日美关税谈判等问题 将继续担任首相

环球网资讯 浏览 5719 07-22

"稀土大王"父子俩挥霍上百亿资产 奢靡儿子1顿饭90万

博览历史 浏览 1753 08-19

该!买!包!了!30款绝美初秋包包!拿去!

Yuki女人故事 浏览 36 09-08

理想重押“智驾老司机”

华尔街见闻官方 浏览 3249 08-06

车企对激光雷达换赛道,主打纯视觉的车,越来越难卖了?

路咖汽车 浏览 5900 05-20

阿里季报图解:营收2477亿 经调整净利降18%因加大对淘宝闪购投入

雷递 浏览 82 08-30

罗马诺:维拉将与卡马拉续约5年,球员的薪水有所增加

懂球帝 浏览 9369 07-25

早期的“9”系SUV,如今月销仅有1辆,已经两年没更新了

星星car 浏览 20 10-01

吴谨言全面复出。于正发文:归来依旧是大女主

猛哥的搞笑视频 浏览 1914 08-02

文章开大G车疑似载着姚笛,马伊琍的话含金量还在上升,网友:天生一对

牛油果生活观 浏览 5445 08-12

世界机器人大会|交卷时刻:人形机器人价格战尚早

北京商报 浏览 5116 08-11

从金鹰女神到过气演员 曾经辉煌的王珞丹是怎么了

归史 浏览 387 07-23

侧记|变革浪潮扑面而来,今日的媒体人要和AI说“谢谢”吗?

澎湃新闻 浏览 8117 07-28

收评:科创50指数涨超3%创年内新高 芯片股集体爆发

财联社 浏览 4239 08-21

杜锋真会整活!张昊配张文逸无球权,内线上两站桩,全运会别瞎搞

篮球资讯达人 浏览 10 10-20

下半年扩消费接续发力 服务消费将成为新增长点

商业观察杂志社 浏览 896 08-07

高考生被骗至缅甸失联 好友:到昆明有人给他5百住酒店

极目新闻 浏览 1046 07-13

8699元学习机成“大板砖”!维修要2499元,家长:交了智商税

北京商报 浏览 24 10-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3