

文丨雨山
AI医疗的竞争,正在从“会不会回答问题”,进入“答案能不能被医生相信”的阶段。
5月13日,阿里健康在杭州正式发布医学AI产品“氢离子”,同时宣布氢离子与英国BMJ集团达成期刊内容独家合作。

据了解,BMJ集团旗下70本医学期刊过往十年发表的内容和多媒体资源,将独家授权提供给氢离子,氢离子也成为BMJ集团在中国独家合作的医学AI平台。
此后,中国医生可以通过氢离子直连全球顶级医学文献,进行循证问答、全文阅读和在线翻译。
这不是一次简单的内容合作,它更像是AI医疗进入“下半场”的一个信号:
当通用大模型已经证明自己足够“聪明”,医学AI真正要回答的问题,变成了如何更可靠、可追溯、可验证地服务医生。
发布会上,阿里健康给氢离子的定位是“可靠的医学AI助手”。按照其表述,氢离子试图在“顶级医学证据”“循证医学”“AI能力”三个维度做好一款医学AI助手,直连国内外顶刊的最高证据源,帮助中国医生解决医学问题。
值得注意的是,在发布会现场,全球最顶尖的医学期刊代表纷纷到场。据阿里健康官方向医线Insight透露,目前正在跟多家国际医学顶刊沟通中,将陆续接入“氢离子”APP。
显然,在医疗这样一个低容错行业里,“可靠”可能比“聪明”更重要。
01
医生已经在用AI,
但医疗AI的核心矛盾是
“能不能被相信”
AI并不是还没有进入医生群体。恰恰相反,医生可能已经是使用AI较积极的专业群体之一。
阿里健康首席技术官兼氢离子负责人王祥志在发布会上提到,团队过去一年跟踪了接近300—400位医生,截至今年3月,接近93%的医生在使用通用大模型,帮助他们查医学知识、查医学文献、查医学解决方案。
但问题也随之出现。
在医学场景中,通用大模型给出的答案如果只是“看起来合理”,并不足够。
王祥志在演讲中将通用大模型的问题拆解为几个维度:临床专业性、循证率、循证真实性。
以其现场举例,一个中国头部大模型在临床专业性评测中只有64%;即使使用非常苛刻的提示词约束,循证率也只有80%。
更关键的是,即使答案里引用了参考文献,仍有超过80%的答案与背后文章没有关系;即便答案与参考文献相关,其中医生真正相信的指南、文献和说明书比例也只有6%。
这组数据解释了医学AI的核心矛盾:医生不是不用AI,而是需要知道AI的答案从哪里来、是否真的被证据支持、能不能被自己验证。
发布会上还举了一个具体案例:技术人员用专业提示词约束通用大模型,要求其查询专业文献并回答“氟泽雷塞”的使用注意事项,以及病人出现漏服时该怎么办,但大模型给出的答案仍存在问题。
王祥志在现场强调,这类错误在医疗场景中后果严重。
这也是阿里健康将氢离子定义为“助手”而不是“医生”的原因。所以氢离子希望成为医生背后7×24小时待命的助手,“不替医生做决定”,而是帮助医生解决医学问题。
如果说AI医疗的上半场,大家都在证明模型“能回答”,那么下半场的竞争重点,正在转向“答案是否有证据”。
对此,王祥志提出了一个公式:医学证据+循证医学+AI,等于可靠的医学AI助手。
值得注意的是,在这个公式里,AI被放在最后。其背后的逻辑是,AI能力本身并不能单独构成医疗场景里的信任,必须先有高质量医学证据和循证医学框架。
这也解释了为什么BMJ的内容合作被放在如此重要的位置。
据了解,BMJ集团成立于1840年,隶属于英国医学会,旗下现有70余种国际医学期刊,其旗舰期刊《英国医学杂志》(The BMJ)被称为全球最具影响力的医学期刊之一。此次合作中,BMJ旗下70本医学期刊过往十年的内容和多媒体资源将授权给氢离子。
对医学AI来说,顶刊内容不是普通语料,而是“证据基础设施”。
于是在过去半年,王祥志团队做了一个重大决定:要和全球顶级的医学期刊开展内容合作。其团队走访美国、英国、德国,与顶级期刊合作伙伴洽谈。
就在数天前,BMJ数据已经推送到氢离子上,医生用户在氢离子查询问题时,在很多情况下可以看到BMJ最新、最时效的医学证据,文献中的图和表也会以更直观的方式放到答案中。
这意味着,医学AI的竞争不再只是模型能力之争,也开始变成证据源、版权合作和内容结构化能力的竞争。
阿里健康董事会主席兼首席执行官沈涤凡在发布会上也提到,如果仅有AI能力是不够的。他表示,希望通过氢离子与世界顶级证据合作,把这些顶级证据通过AI能力和推理能力,以更简便、易用的方式提供给中国500万临床医生。
02
从顶刊内容到医生工作流,
阿里健康押注的是“循证AI”
阿里健康切入医学AI的另一个背景,是医生获取医学证据的过程仍然高度割裂。
王祥志在演讲中提到,中国有500万医生、14亿人口,一年有超100亿次诊疗人次。每一次诊疗背后,一个处方、一个医嘱、一个临床手术方案的制定,都需要医生基于医学知识和最新医学证据作出决定。
但医生获取这些知识和证据的过程并不顺畅。
据调研,今天医生获取医学知识和临床证据时,手机里往往有5、6个应用;超过50%的医生会通过4个以上应用解决问题,例如查询用药、查询指南、查询中文文献、查询英文文献分别使用不同工具。
与此同时,超过80%的医生在面对生僻词汇和专业医学术语时,需要借助各类翻译工具。
背后折射的不是简单的效率问题,而是医生工作流的问题。
氢离子试图覆盖的,正是医生从“提问”到“搜索”再到“阅读”的完整链条。
在现场,氢离子发布了三大功能:精准智能问答、搜索和阅读。问答解决的是医生直接要答案的需求;搜索解决的是医生寻找证据列表的需求;阅读则被称为获得医学支持的“最后一公里”。
在阅读环节,医生点击阅读原文时,可以看到AI总结出的文献临床方法、实验人群、临床证据和实验结果等结构化内容。
要知道,此前医生可能需要1—2个小时完成一篇文献核心内容提取,现在在氢离子中只需要3—5分钟抓住重点。氢离子还提供沉浸式原文阅读和医学翻译工具,支持原文与中文对照。
这也是BMJ合作的现实意义所在。王祥志提到,76%的医生在获取文章时会遇到较大困难;对于国际顶级期刊,不同层级三甲医院医生都有强烈阅读需求,但无论哪本期刊,都会有接近40%甚至超过50%的用户无法获取文献。
他还转述医生反馈称,这些获取障碍会对临床决定和科研决策造成不可估量的损失,“也许当医生想去改变一个临床路径的时候,阻碍他们的就是那一个个打不开的PDF。”
这句话几乎可以概括医学AI下半场的产品机会:医生不只是需要一个聊天机器人,而是需要一个能把分散证据、文献阅读、语言转换、引用溯源整合起来的工作流工具。
医学AI要赢得医生信任,不能只靠内容授权,还需要一套围绕循证医学设计的系统。
具体而言,氢离子采用四层循证AI架构。第一层是证据理解与内容体系,所有指南和文献进入系统时,会基于PICO框架和GRADE标准进行结构化理解;第二层是基于PICO的检索与数据增强,保证输出的每一句话都有据可查;第三层是模型强化与微调,让模型学习什么是准确、忠实循证、安全有用的答案;第四层是医学专家评审体系,完成质量闭环。

王祥志在现场也解释了这套技术逻辑。他提到,医生不仅关心答案是否正确,也关心答案背后的支撑是什么。
因此氢离子上线了动态证据定位功能:每一个答案、每一个Claim,用户点击背后参考来源时,会看到证据来自哪篇文献、哪一个段落、原文是什么。
这其实是在承认一个现实:生成式AI可能有错误。氢离子的做法不是宣称AI永远不会错,而是“把证据还给医生”,让医生检验每一个答案背后的证据是否可信。
这也让氢离子区别于单纯的医学问答产品。它不是只追求答案生成,而是在答案生成之前,先完成证据理解、证据检索、证据匹配;在答案生成之后,再通过动态定位和专家评审建立验证机制。
换句话说,医学AI下半场的技术壁垒,可能不只是模型参数或生成效果,而是能否把循证医学方法论嵌进AI的每个关键环节。
从发布会信息看,氢离子瞄准的是医生端生产力工具,而不是泛健康问答。
沈涤凡提出,医疗健康领域最大的生产者、最大的专家是医生。
中国真正的医生有500万人,不同地区、不同层级医疗机构的医生,在接触顶级证据上存在巨大鸿沟。根据其现场表述,调研中超过七成医生表示,获取顶级证据和顶级医学知识很困难。
这也是阿里健康做氢离子的核心出发点:用AI帮助中国医生读期刊、读医学知识,并把答案根据需求送到他们面前,缩小医生之间的知识鸿沟。
从产品定位看,氢离子想做的不是替代医生,而是成为医生获取证据和知识的入口。王祥志提到,氢离子1.0还是一个“小Baby”,未来还需要在更多场景中突破,包括罕见病、多学科会诊、科研、科研方案设计、科研想法探讨、学术分析、医生成长和教育等。
以上措施意味着,阿里健康在AI医疗上的切入点,并非先做单一场景的自动化,而是试图围绕医生的知识需求和科研需求建立长期工作流。
在这个逻辑下,BMJ独家合作不只是一次内容补充,更是阿里健康进入医生专业场景的关键一步。
毕竟,医生愿不愿意长期使用一个医学AI,取决于它是否能持续提供最新、权威、可验证的证据。
03
AI医疗的终局,
不只是产品竞争,更是标准竞争
AI医疗越往临床靠近,越绕不开标准问题。
氢离子在发布会上宣布成立“医学AI专家委员会”,邀请超300位中国临床专家共建医学AI评价标准与数据集。
其中,黄晓军教授、肖瑞平教授、于金明教授等10位国内各学科顶级专家负责整体学术方向把关;50位指导委员会成员制定评测标准与方法论;数百位评测医生来自复旦100强医院,对AI回答进行持续验证与反馈。
北京大学未来技术学院创始院长、医学AI专家委员会顾问肖瑞平在致辞中表示,氢离子医学AI专家委员会的成立,不仅搭建了一个新平台,更是医学AI从技术走向规范、安全,真正推动行业进步的重要探索。
她强调,AI越往前走,越需要标准、底线、定力和方向;什么样的AI是安全的、可信的,不能只靠技术回答,还需要和医生合作,必须由临床、科学证据、技术融合和规范治理共同回答。
同时,一个可靠工具要经得起医生、临床循证和临床效果的考验;专家委员会不是为了搭建一个“虚名的平台”,而是要建立一个面向临床、经得起检验、权威且有循证基础的AI评价体系。
这说明,医学AI的下半场不仅是产品竞争,也是标准竞争。
谁来定义“可靠”?谁来判断一个医学AI的答案是否符合循证医学要求?谁来验证AI在不同专科、不同疾病、不同临床问题中的表现?这些问题将直接影响医学AI能否从演示场景进入医生日常使用。
肖瑞平在致辞中进一步表示,中国需要有自己的权威学术声音,需要建立立足临床实践、符合中国国情、经得起国际检验的医学AI标准体系,并以严谨态度、科学方法和临床实践,打造属于中国、服务中国、并能走向世界的医学AI标准。
这也是“下半场战役”的另一层含义:当医学AI开始从工具走向基础设施,它必须同时回答技术问题、临床问题和治理问题。
BMJ独家牵手氢离子,是阿里健康在AI医疗上的一次重要落子。但这次合作背后的意义,不止于“接入了70本顶刊”。
2026阿里健康氢离子产品发布会现场,全球最顶尖的医学期刊代表纷纷到场。据阿里健康官方透露,目前正在跟多家国际医学顶刊沟通中,将陆续接入“氢离子”APP。
它所指向的,是医学AI竞争逻辑的变化:从拼模型,走向拼证据;从拼生成能力,走向拼可验证能力;从拼产品功能,走向拼医生工作流和行业标准。
当AI算法不断进步,模型在迭代、数据规模在扩容,但真正能让技术产生价值的,从来不是冰冷的数据,而是它是否能走进诊室、服务科研;循证医学的标准,则让这份高效有了科学支撑与严谨保障。
这或许正是AI医疗下半场的核心命题:AI不是替医生做决定,而是帮助医生更快接近证据、更好验证答案,并最终回到临床与科研现场。
因此,BMJ与氢离子的合作,只是这场战役的开端。
排版丨乔雨林
制图丨医线Insight
-END-