关闭广告

研究人员构建临床试验数据库,为开发垂直Agent提供数据源

DeepTech深科技2025-08-04 00:00:01490人阅读

多年来,美国伊利诺伊大学香槟分校博士毕业生、Keiji.AI 公司联合创始人王子丰一直在研究将 AI 应用于临床试验,并已开展多个相关项目,包括开发用于临床试验系统评价的辅助工具 TrialMind [1] 和 LEADS [2],提升试验招募效率的 TrialGPT [3],支持生物医学数据分析的智能平台 DSWizard [4,5],以及自动生成临床试验文档的系统 InformGen [6]。


图 | 王子丰(来源:王子丰)

在推进这些研究的过程中,王子丰逐渐意识到,尽管制药业内对 AI 在临床试验中的应用充满期待,但仍面临诸多关键挑战。

首先,目前缺乏有效的评估手段,使得大模型难以在临床试验场景中实现可验证、可落地的应用。

其次,真正理解制药行业实践的专业人士与 AI 技术专家之间存在明显的知识壁垒,跨领域协同不足,也限制了技术转化的深度和广度。

而在构建垂直领域模型和 Agent 的过程中,人们又面临着两个根本性的问题:一是缺乏结构清晰、适合 AI 训练的高质量数据资源,二是缺乏贴近真实临床试验任务、能够系统评估模型能力的基准任务集。

业界其实有一些出售临床试验商业数据的公司比如 Citeline,但是这些数据都非常昂贵,一般大型的制药企业可能每年向他们支付数百万美元以上来获取这些信息。而公共数据比如 ClinicalTrials.gov 只包括了在美国注册的试验记录,而很多的多个国家试验记录以及发表的试验都需要被额外收集和标准化处理。

基于上述问题,王子丰等人启动了本项研究,构建了临床试验领域的大规模结构化数据库 TrialPanorama [7],汇聚了试验设计、干预手段、适应症、生物标志物、结局指标等核心要素,并对接权威医学本体,确保数据的一致性与可扩展性。在此基础上,研究团队进一步设计了一套配套的评测任务集,涵盖从文献评价到试验设计的多个关键环节,以用于系统性地评估 AI 模型在临床试验相关任务中的能力。该工作不仅为模型的训练与测试提供了高质量数据支撑,也为后续开发 AI Agent 提供数据源。

如前所述,本次研究的主要成果是构建了一个覆盖广泛、结构清晰的临床试验数据库 TrialPanorama,共收录了来自全球 15 个来源的 1,657,476 条临床试验记录以及汇总这些临床试验的超过 9,000 篇系统评价论文。该数据库系统性地整理了临床试验设计与实施的关键要素,包括研究方案、干预方式、适应症、生物标志物和结局指标等,并与标准医学本体(如 DrugBank 和 MedDRA)进行了对齐,具备良好的规范性与可扩展性。

在此基础上,研究团队还首次设计并发布了一套面向临床试验任务的大模型评测基准,涵盖系统评价和试验设计累计两个类别和八项任务,这八项任务包括研究检索、研究筛选、证据总结、试验组设计、入排标准制定、终点选择、样本量估计及完成情况评估。通过在五个当前最先进的大模型上开展实验,研究团队发现通用模型虽然具备一定的零样本能力,但其表现尚不足以胜任高风险、要求严谨的临床试验场景。

而本次工作不仅提供了一个高质量的数据基础,还构建了可用于训练、评估和推动临床试验 AI 研究的系统平台,有望为开发更具专业性和实用性的智能系统奠定坚实基础。


(来源:https://arxiv.org/pdf/2505.16097)

本次研究成果具有广泛的应用前景,预计能在以下几个方面发挥重要作用:

首先,TrialPanorama 数据库可以作为医药研发和医学事务中基于 AI 的知识发现平台。例如,人们可以借助该数据库检索某一适应症下既往的治疗手段及其结果、正在研发中的同类药物等关键信息,从而辅助制定更科学、更具前瞻性的临床试验方案。

其次,该数据库为训练大模型提供了数据基础。由于其结构清晰、覆盖全面,非常适合用于生成高质量的训练样本,推动更贴近临床场景的专用语言模型的开发。同时,研究团队发布的 benchmark 也为评估现有及未来的大模型在临床试验任务中的表现提供了统一、专业的测试框架。

最后,对于当前越来越多专注于临床试验领域的 AI Agent 系统来说,TrialPanorama 提供了结构化、标准化的数据资源,并可以通过集成模型上下文协议(MCP,Model Context Protocol)服务器实现快速接入与部署,从而助力构建高可靠性、高专业度的垂类 AI Agent,为临床研发带来赋能。


(来源:https://arxiv.org/pdf/2505.16097)

多年前,王子丰就开始研究 AI,同时做一些 AI for healthcare。一开始进入这个方向时,他觉得有很多的“low-hanging fruit”,他认为只要把大模型用上、Agent 搭起来,然后就可以开展很多临床试验的任务。但是,当他真正在项目中和医生、药厂的研发人员、销售等各类角色深度接触之后,王子丰才意识到很多现实中的核心需求,其实并没有被很好地抽象成 AI 问题然后被做 AI 的人们注意到。

这中间有很多令人反思的时刻。比如他经常看到一些很酷炫的大模型demo,但是药厂的合作方告诉他,他们可能也会去尝试一下,然而很多时候实际效果往往不能达到可用的程度,或者说由于公司的合规性要求这些工具还不能够嵌入他们的工作流。

而作为一名 AI 研究者,王子丰认为得学会放下自嗨的技术视角,真正去倾听用户的痛点,理解他们的工作流程、合规限制和实际目标,然后再回过头来重新定义问题,想办法用 AI 去解决。

同时,这个“对话”和“重构”的过程,是王子丰在本次研究之中认为最有价值、也是最难忘的部分。这不仅仅凸显了当前的一些技术挑战,更是对于跨学科协作、产品思维、沟通能力的一种锤炼。

至于创业,它对王子丰来说也是一种自然的延伸。王子丰觉得做应用研究的人去创业其实非常合适。一方面你能从一线看到很多真实又有挑战的问题,另一方面你也有机会把研究成果真正落地,帮助到药厂、医生甚至患者。这种“从问题中来,到应用中去”的过程,非常充实,也让王子丰找到了科研之外的成就感。

正因此,王子丰联合创办了 Keiji.AI,在该公司他主要负责 AI 算法和应用的开发。该公司由王子丰的博士导师 Jimeng Sun 教授领衔,团队成员主要来自美国伊利诺伊大学香槟分校的研究团队。公司致力于将研究团队多年来在 AI 医疗和临床试验领域的研究成果转化。

基于这一背景,研究团队开发了 TrialMind 平台,集成了多种 AI Agent 和工作流程,并接入研究团队自建的 TrialPanorama 数据库,支持临床试验的方案设计、队列抽取、数据分析、患者招募等关键环节的智能化加速。

目前,研究团队的客户和合作伙伴包括多家制药公司(如Takeda、Abbvie、Regeneron)、真实世界数据公司(如 Medidata、Guardant Health),以及大型 CRO(如 IQVIA)。公司正处于快速发展阶段,正在积极推进融资并扩大团队。而基于上述工作,他们正在基于本次数据库开发临床试验的垂类 AI Agent 和模型。

参考资料:

1.https://arxiv.org/abs/2406.17755

2.https://arxiv.org/abs/2501.16255

3.https://www.nature.com/articles/s41467-024-53081-z

4.https://arxiv.org/abs/2410.21591

5.https://arxiv.org/abs/2505.16100

6.https://arxiv.org/abs/2504.00934

7.https://arxiv.org/abs/2505.16097

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子发现女友怀孕还没离婚:那我岂不是小三吗

极目新闻 浏览 8647 07-24

美对印强征关税后再羞辱 美财长:印不是全球重要角色

澎湃新闻 浏览 382 08-01

OPPO 陈希透露有厂商因不能及时上 12306 服务被用户差评去闹

IT之家 浏览 93 08-22

协同推动机器人科技创新与产业发展,2025世界机器人大会新闻发布会在京召开

蓝鲸新闻 浏览 867 08-03

以军继续袭击加沙城

环球网资讯 浏览 161 08-31

付辛博颖儿七夕合体提车,夫妻俩一人买一台,AA制婚姻一样长久

萌神木木 浏览 154 08-30

00后暑期旅游样本调查:九成依赖社交平台,高性价比与“窝囊旅行”受青睐

第一财经资讯 浏览 1601 08-10

这一次变了面相的关晓彤给所有女星提了个醒

探长影视解说 浏览 2936 08-16

国羽汤杯与印度队争小组第一:石宇奇休战,李诗沣任一单

懂球帝 浏览 10 04-29

淘宝闪购消费券效应拉动餐饮就业“小阳春”:钉钉餐饮从业人数增长数十万

上游新闻 浏览 6851 07-22

袁立吐槽章子怡、张国立:有钱能使鬼推磨

冷紫葉 浏览 8563 08-05

何超莲晒团圆照!窦骁缺席

小娱乐悠悠 浏览 97 10-09

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 74 10-05

米体:队史最贵引援,佛罗伦萨总价2700万欧+10%二转分成签皮科利

直播吧 浏览 166 08-22

许凯爆雷,赵晴被点名,于正怒斥被资本做局了

最爱酷影视 浏览 145 08-23

美媒补刀:高市早苗挑衅中国 日本承受不起

澎湃新闻 浏览 84 11-25

什么信号?利好,又要来了?!

米筐投资 浏览 95 12-29

电商老板的焦虑,在被飞书解压?

虎嗅APP 浏览 106 11-04

宜宾纸业因信披违规收警示函,收购醋纤公司未及时披露1.9亿元资金滞留

红星资本局 浏览 6996 07-22

意媒:罗马正在评估引进斯特林的可行性,可能提出租借方案

懂球帝 浏览 86 01-29

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 204 09-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3