新药开发是一个漫长、昂贵、高风险的过程,其中大约一半的时间和投资消耗在临床试验阶段,而临床试验的高失败率又使其成为新药研发中最困难的一步。临床试验是药物开发的基石,成功的药物开发依赖于准确且有效的临床试验。
据研究,约有90%的药物会在临床试验阶段被淘汰,进入临床Ⅱ期的化合物中,不到三分之一能进入临床III期,在进入临床Ⅲ期的化合物中,又有超过三分之一的化合物未能成功获批上市。由于Ⅱ、Ⅲ期临床试验处于整个药物开发阶段后期,且最复杂的III期试验成本约占整个试验的60%,因此,每项失败的临床试验均会造成巨额损失。
一篇发表在Nature子刊《npjDigitalMedicine》,关于数字化临床试验文章指出,目前传统临床试验存在参与率过低、临床试验进展缓慢等问题。在受试者招募、筛选、数据采集和质控等方面的效率低下,会给受试者以及研发企业带来经济和时间上的负担,且延长临床试验时间。
药物研发阶段及化合物在各临床试验阶段成功率
一、AI助力新药临床试验人工智能(artificialintelligence,AI)的发展,为新药研发带来了新的技术手段,尽管目前AI技术大多应用于药物发现及临床前阶段,但在临床试验环节,也可以利用ML、自然语言处理等技术辅助临床试验设计、患者招募和临床试验数据处理等。
用于临床试验设计的AI技术:从方法到结果改善
1. AI在临床研究中的分析类型及目标
AI临床试验方案设计是指利用人工智能技术辅助和优化临床试验设计的过程。它利用ML(机器学习)、DL(深度学习)、自然语言处理(NLP)、决策支持系统(DSS)等技术,快速处理同类研究、临床数据和监管信息,以及读取临床试验等数据,以提供更有效的临床试验方案。
欧美在临床阶段对AI技术的应用起步较早,主要在应用自然语言处理 (NLP)、改进病人分层、简化临床试验的操作流程三个大的层面。通过收到的超过300份AI临床研究申请,FDA归纳分析并对该技术进行了总结,将AI在临床阶段的应用分成了“六大分析类型”与“九大分析目标”。
AI在临床研究中的分析类型及目标
六大分析类型:结果预测、协变量选择/混杂调整、药物剂量模型、异常检测、图像/视频/语音分析、RWD表型/自然语言处理(NLP)
九大分析目标:药物发现再利用、药物毒性预测、患者富集设计、患者风险分层/管理、选择/优化剂量、设计服药依从性/遵循给药方案、合成对照组、评估终点/生物标志物、上市后监测
近年来,AI在临床研究中不乏成功案例。如:成立于2016年的美国企业Owkin,使用联邦学习来训练和开发其机器学习模型,专门用于提高临床试验效率,并已经建立了一个高级模型目录,使他们能够从成像、基因组学和临床数据中识别新的生物标志物。Owkin致力于识别具有严重疾病进展特征的患者,这些患者可能对开发中的治疗反应最好,目前该公司总共筹集了2.54亿美元,其中包括赛诺菲、Bpifrance和Mubadala等投资机构。
另一家来自剑桥的公司GNShealthcare,成立于2000年,该公司的技术基于各种复杂的数据创建“虚拟患者”,这是一个准确的疾病计算机模型。GNS专注于肿瘤学、免疫学、中枢神经系统和心脏代谢疾病,他们的技术支持更好的病人分层,并能确定哪些病人应该接受一线或二线治疗。
2. 临床研究AI国内企业布局
2022年8月,国家药品监督管理局药品审评中心(CDE)连发三项意见稿,支持远程智能临床试验方案的应用和发展,强调在合规且可行的范围内提高患者参与临床试验的便利度、减轻患者参与临床试验的负担,并对数字化、智能化等新技术在临床试验中的合规运用进行了细致的规定。而在此前,CDE已下发的2项建议中已强调ePRO在数据采集方面所体现出的高效性、实时性、灵活性、合规性、安全性和其在患者隐私保护等方面所具备的显著优势。
几项政策立足“以患者为中心”的理念,接轨国际诸多监管机构对临床试验智能化的政策,为中国临床试验进一步实现从“纸”到“云”的发展变革提供了方向。紧随技术发展趋势,基于国家政策,我国AI+临床试验企业迎来发展机遇。
据药融咨询统计,国内目前涉足AI+临床企业不多,截至2023年9月1日,约16家,可大致分为AISaaS、AIBiotech、AICRO以及AIBiotech+CRO四种商业模式。
国内涉足AI+临床研发主要企业
从十六家企业在临床阶段的具体业务类型来看,主要包括:临床试验方案设计,如患者筛选/招募等,以及临床结果预测、临床试验数据统计分析。从企业类型来看,可提供AI+临床试验企业多为向药企或CXO企业提供服务的企业,此外,一部分企业实施“双业态”运营模式,仅在少数特定治疗领域内开发自有产品管线,而在大多数治疗领域对外提供AI赋能的临床设计服务。
二、AI助力受试者招募管理1. 最新技术举例
患者招募是决定临床试验是否成功的关键因素之一,临床试验的入组标准通常有很严格的限制,研究显示,大约80%的进展期非小细胞肺癌(aNSCLC)患者不符合临床试验的资格标准,导致约86%的临床试验由于无法按时招募足够的受试者而终止。而大样本的随机对照临床试验(RCT)是临床证据的主要来源,但受试者的招募往往因为试验方案的入组标准严格而影响进度。
相关研究证明,结合真实世界数据,AI可自动筛选符合入组标准的患者,提高招募效率。AI辅助药物临床试验受试者招募,总体可以看作是利用自然语言处理、机器学习等技术,对不同来源的受试者信息和临床试验方案的入组/排除标准进行识别和匹配的过程。《Nature》发表的一项研究介绍了AI在简化临床试验入组标准方面的价值和应用,通过使用开源的人工智能工具TrialPathfinder,从肿瘤患者的真实世界数据中学习,来优化入组标准的包容性,该工具可以使用EHR数据模拟临床试验,按照不同的入组标准自动整合EHR数据,并分析总体生存风险比率,同时,使用逆概率加权法来调整基线混杂因素和模拟随机化。分析结果显示,许多常见的入组标准,对临床试验的结果影响甚微。
用于临床试验设计的AI技术:从方法到改进结果
TrialPathfinder包括临床试验模拟和分析两部分。在临床实验模拟中,TrialPathfinder将真实世界数据和目标试验方案(治疗和资格标准)作为输入,根据患者特征、诊断、实验室值、生物标志物和先前的治疗方法,以编程方式对不同的入组标准(从文本中提取)进行编码,并使用倾向评分的加权分析法进行临床试验模拟。然后对模拟的治疗组进行生存分析,并报告符合条件的患者数和由此产生的风险比。在分析中,TrialPathfinder将标准的重要性分析与Shapley值相结合,评估了每个纳入/排除标准如何影响合格受试者的数量和试验结果。研究表明,几个常用的纳入/排除标准不会对试验的总生存期的风险比产生实质性影响,也不会潜在地降低试验的有效性。
此外,一项回顾性分析全面了解了AI在临床试验注册登记中的应用现状[4],并评估该技术筛选患者的准确性,这是第一项评估AI用于癌症临床试验登记的系统性回顾和meta分析。数据显示,除一个数据集外,所有数据集的准确性、灵敏度和特异性均超过80%,17个数据集中有5个的阳性预测值超过80%,所有数据集中的阴性预测值均超过80%,汇总敏感性为90.5%(95%CI:70.9%-97.4%);总体特异性为99.3%(95%CI:81.8%—99.9%)。总的来说,AI在患者筛选方面的表现似乎与人工筛查持平,且AI拥有更高的效率,可花费更少的时间和资源。
2. 国内企业布局
药融云数据库显示,目前多家AI制药企业在助力患者入组的研究上已取得一定成就。如IQVIA、Unlearn、ConcertAI等,ConcertAI的DTSeScreening采用了机器学习算法LightGBM来开发17个模型,这些模型根据各种标准预测患者参加临床试验的资格,包括ECOG评分(癌症研究中采用的标准衡量标准),使用的其他指标包括癌症分期、实验室结果和生命体征,平均预测准确率超过99%。
2020年,FDA同意MedidataSyntheticControlArm® 合成对照组解决方案(“SCA®解决方案”)应用于美国临床阶段免疫治疗公司MedicennaTherapeutics公司(“Medicenna”)一项MDNA55治疗复发性胶质母细胞瘤的III期注册试验中。在此试验中,Medidata成功帮助Medicenna在此三期临床中减少招募了100个对照患者,这也是罕见病试验首次采用混合外部对照组,也开启了III期临床试验应用混合外部对照组的先河。
国内企业运用AI助力临床试验患者招募/入组尚处于起步阶段,代表企业包括普瑞基准、埃格林、西湖欧米以及锐格医药等。这些企业并非专注于临床阶段或临床试验患者招募,而多覆盖药物开发多个流程,如科辉智药,其AI驱动的研发平台eLEAD是覆盖研发全流程,AI筛选患者人群是其中一部分。锐格医药主要通过自主研发的rCARD™(计算机加速新药研发)平台来发现和开发临床差异化的创新药物。
哲源科技可进行虚拟临床试验,预测响应患者。据哲源科技官网披露,其核心技术包括TWIRIS(生物医学文献处理算法-大规模生物医学知识AI平台)、DAGG(基因组霰单枪损伤评估算法-细胞功能定量评估AI平台)、Dpverse(泛癌种功能数字化病人库MOA虚拟平台)。在研管线中,为全新机制、全新靶点药物管线共3条,ZY0001(胰腺癌、小分子)、ZY0002(泛癌种、大分子)、ZY0003(胰腺癌、小分子),均处于药物合成阶段。
零氪科技提供第三方服务,主要开展基于精准生命科学解决方案(LinkSolutions)的临床招募、真实世界研究、数据洞察等服务。其临床研究招募主要采用机器学习算法将已知的信号通路和药物靶点库进行匹配,以预测个性化治疗和患者耐药点的有效性,实现患者对特定临床试验的最佳适配性。
埃格林是具有从靶点到临床试验“端到端”能力的AI赋能创新药企,埃格林采取自研+对外服务的模式,一方面,从事自有药品管线的研发,另一方面,对有人工智能研发需求的制药企业,提供创新药开发服务与合作。
三、AI助力预测临床试验效果1. 最新技术举例
鉴于临床试验的高失败率,以及药物开发的资金密集型性质,制药公司只能承担有限数量的项目,因此开发者通常不得不中止一些项目,以支持成功概率更高的药物进一步开发。对于继续研发药物的选择,目前常用的方法基本上是基于管线上药物的治疗类别,和所处开发阶段历史上其他药物的监管批准率,结合对项目特定风险因素的非结构化讨论和主观调整,来做出投资决策。
对于临床试验效果的预测,在药物开发中一直难以达到。AAPS于2022年一月发表的一篇关于在制药研发过程中应用机器学习/人工智能预测技术和监管成功概率的文章指出,关于临床试验效果预测尚未有经验证的报告[1]。但AI技术发展迅速,此后,不少文章研究结果显示,尽管具有难度,但对于AI临床试验结果预测,从技术上看,正在朝着积极的方向前进。
HINT:端到端的神经网络模型
其中,《CellPattern》于2022年4月发布了首个临床试验结果预测公开数据集,提出了基于深度学习(图神经网络)的临床试验结果预测方法。作者设计了一种基于图神经网络的深度学习方法,可以显示的模拟不同的临床试验因素及其交互关系,从而预测试验结果,该方法被命名为Hierarchicalinteractionnetwork(HINT)。HINT在临床I期、II期和III期的预测中分别获得了0.665、0.620和0.847的F1分数。
部分AI预测临床试验效果相关文章
2. 国内企业布局
目前,国内可将AI技术用于临床试验结果预测企业较少,代表企业包括英矽智能、白星花科技、西湖欧米。2023年8月3日,国内领先的生成式人工智能(AI)驱动的生物医药科技公司英矽智能,利用其自主研发的基于Transformer的人工智能临床试验预测引擎inClinico,高度准确地预测了多项临床试验II期至III期的转化结果。这项研究成果已发表在《CLINICALPHARMACOLOGY&THERAPEUTICS》上。
2014年以来,英矽智能长期致力于开发用于II期到III期临床试验转化成功率预测的人工智能模型。英矽智能搭建的高效人工智能药物研发平台Pharma.AI,包括PandaOmics™、Chemistry42™、inClinico™三大组成部分,其中inClinico™是一个SaaS模式的在线软件系统,旨在预测临床试验II期至III期的转化成功率,它整合了多种评分方法、多模态数据源(包括文本、组学、临床试验设计和小分子特性)以及生物学背景,并与深度学习模型相结合。2022年11月以来,inClinico™以SaaS形式提供服务。
用于预测临床试验结果的人工智能框架和数据源概览
根据英矽智能发表的论文,inClinico平台在55,000多项独特的II期临床试验中进行了训练,并在回顾性、准前瞻性和前瞻性验证研究中进行了验证。在准前瞻性验证中,inClinico在预测临床试验II期至III期的转化成功率方面的ROCAUC达到了0.88。在前瞻性验证中,它对真实世界临床试验结果预测的准确率达到了79%。
除了成功预测多项临床试验II期至III期的转化结果外,该研究结果还表明,靶点选择比临床试验设计更有可能影响临床试验结果预测。此外,论文还展示了inClinico的投资应用,使用了日期标记的虚拟交易组合,展示了35%的9个月投资回报率。以投资为目的的实践还表明,inClinico可以为投资者提供技术上的尽职调查见解,并帮助制药公司确定药物开发项目的优先次序。
inClinico用于预测临床试验结果的人工智能框架和数据源概览
inClinico核心用途和功能
四、AI助力临床试验数据管理1. 最新技术举例
新药研发是一个数据密集型的工作,虽然过去几年中AI取得了令人瞩目的进展,但研究者们仍然面临着海量数据的挑战。如临床研究数据管理需要包括从研究设计、研究注册、数据采集、患者随访、项目管理、安全预警、数据管理与初步分析的全链条管理。
单临床试验的纳入/排除标准可能多达六七十项,而这些标准可能包括实验室检查结果、过去的药物暴露史、药物反应等。此外,临床试验数据的固有复杂性和多样性面临着进一步的挑战。如在肿瘤治疗领域,临床试验通常包含多方面的设计,包括复杂的组织取样和分子处理要求。因此,医疗组织必须确保拥有具备经验丰富的医护人员,但传统的数据收集管理存在诸多问题,数据的可靠性、安全性和准确性得不到保证、数据易丢失、数据核查的工作量太大、数据管理的费用过高且过程较为繁琐等,整个过程会推迟临床研究进展。改革传统临床数据管理模式迫在眉睫。如何完整、及时、高效地采集数据变得尤为重要,人工智能和机器学习工具的使用也应运而生。
具体而言,AI在临床试验数据管理方面的应用包括数据收集和整合,数据清洗和标准化,数据监测和质量控制,以及数据分析和预测等。目前,在临床试验数据管理中,运用AI的主要技术包括:ML(机器学习)、DL以及NLP等。
近年来AI在临床试验数据管理方面已取得一定进展。如:在2023年美国临床肿瘤学会(ASCO)会议中,ConcertAI分享了它如何成功地自动化了一项研究所需的55%的数据,该公司研发的DTSeScreening软件,是一种基于ML的工具,旨在根据临床试验入排标准对患者进行排名;2023年6月13日,领先的临床数据技术和自动化公司Beaconcure宣布获得1400万美元B轮融资,Beaconcure的人工智能平台Verify是与辉瑞联合开发的,它简化了临床试验数据统计分析过程并使之自动化。
此外,生成临床研究报告(clinicalstudyreports,CRS)是临床试验的重要组成部分,通常需要数周或数月,而 NLP处理先驱Yseop于2023年6月推出“YseopCopilot”,据Yseop,使用该技术自动撰写CSR有助于将报告撰写时间平均减少40%。YseopCopilot采用了预训练的大型语言模型,并结合了数据到文本(符号AI)和文本到文本(预训练的开源LLM)技术。
2. 国内企业布局
国内,将AI技术应用到药物开发的临床及临床后阶段企业较少,在IND阶段后,对临床试验数据的管理、分析是应用相对较多的场景,主要有普瑞基准、耀乘健康等企业。
据公开信息披露:耀乘健康科技AI技术团队实施了AuroraPrime底层架构与OpenAI的对接,并着手在多条产品线中实际落地应用场景。包括:PrimeCreate、PrimeCoordinate、PrimeCatalog等等。PrimeCatalog是在AuroraPrime平台上构建的企业级文档管理系统,包含了 eTMF、项目公盘等文档产品,满足了企业级文档、项目级文档和项目 eTMF多维度的文档管理诉求。在OpenAI助力下,可结合项目 eTMF目录结构以及上传的文档名等关键信息,在用户操作过程中智能推荐文档的归档位置等,提升整体文档管理效率。
AuroraPrime临床研究平台
国内将AI应用于临床试验数据管理的代表企业及应用场景
五、AI赋能药物注册eCTD申报CTD(TheCommonTechnicalDocument,共同技术文件)是国际公认的文件编写格式,用来制作向药品注册机构递交的结构完善的注册申请文件。一共分为五个模块,模块一行政管理文件和药品信息;模块二通用技术文档总结;模块三质量;模块四非临床试验报告;模块五临床研究报告。
其中,模块一为区域性要求,具体内容和格式由相应的监管机构规定,模块二、三、四和五为国际通用要求。电子通用技术文档(eCTD)是对CTD的一种电子化呈现和管理方式,通过可扩展标记语言(XML)技术将基于CTD文件结构和eCTD技术规范的文件加以组织,并用于药品注册申报和审评的一种注册文件技术格式。eCTD使申报资料编制、申报、受理、审评、全生命周期管理和档案存储更加便捷经济,既保障了资料的申报质量,又提高了审评效率,更重要的是使申报资料的格式、内容及标准要求保持全球通用性和一致性。
中国国家药品监督管理局已自2021年12月29日起全面开展和推进药品电子通用技术文档(eCTD)申报,正式打开了eCTD申报时代的大门。可以预见,随着eCTD在我国的全面实施,递交网络化及验证自动化、eCTD4.0试点以及云数据和AI自动化等应用也将逐步落地。
目前国内较为典型的是成立于2017年的深度智耀,其自主研发的AI智能系统和相关服务覆盖制药研发全链条,其中就包含全球注册申报以及文本智能(医学写作、医学翻译、eCTD递交、文档管理)等各模块。在临床研究阶段,包括AI驱动的药物警戒系统、注册事务系统、写作翻译系统、临床数据编程系统等产品。另外,公司的AI自动翻译写作申报系统实现集医学写作、医学翻译和注册申报“三位一体”的人机交互自进化平台,改变以往上述三大环节的割裂状况,重构了传统的数据文件整合模式。
结语:随着人工智能技术的飞速发展与深度渗透,临床试验这一新药研发的关键环节正经历着前所未有的变革。AI不仅优化了临床试验设计,提高了患者招募的效率与精确度,还展示了在预测临床试验结果方面的巨大潜力,为药物研发提供了更为科学、高效的决策支持。
国内外企业在AI+临床试验领域的积极探索与布局,不仅加速了研发进程,减少了成本损耗,还进一步推动了个性化医疗和精准医疗时代的到来。相信未来,AI将持续深化其在药物临床试验中的角色,从提高成功率到降低风险,从加速上市进程到增加患者福祉,全面赋能新药研发。
<END>