即使没有生成式AI在近一年多来的大热,AI+医疗也已在全流程发挥越来越大的作用,并持续稳定地吸引着资本市场的关注。根据蛋壳研究院《2023数字医疗年度创新白皮书》的统计,尽管在过去一年遭遇了资本“寒冬”,但AI+医疗热度不减,无论在融资事件数还是在融资额上都遥遥领先其他数字医疗细分领域。
越来越多的人正意识到,AI算力正成为如同传统的水、电、气一样的基础设施。在这样的背景下,作为主要AI算力供应商,NVIDIA的一举一动备受关注。在近日举办的GTC(GPU Technology Conference)上,医疗健康首次成为了聚光灯下的主角,引发了广泛关注。
8年提升1000倍AI性能,软件生态迭代打造“护城河”
根据统计,本届GTC上与生命科学/医疗保健有关的会议共计90余场,首次超过了硬件、半导体、汽车等科技领域,居全行业第一。NVIDIA创始人兼首席执行官黄仁勋更是在会上明确表示,医疗健康领域将成为NVIDIA下一个“数十亿美元级业务”。
当然,这并不代表NVIDIA会直接转变为一家医疗企业,更多还是从AI的角度实现对医疗领域的赋能。为了支撑医疗AI,NVIDIA也从提供算力基础的硬件和实现应用部署的软件方案两方面给予助力。
生成式AI堪称过去几年以来AI领域的最大突破,但其对算力的需求也达到了创纪录的水平。以知名的GPT-3.5大模型为例,其用于大模型训练的总算力消耗达到了3640PF·天,即按照每秒计算1千万亿次的算力需要计算3640天。这需要7~8个投资规模30亿美元、算力500P的数据中心才能支撑运行。
少为人知的是,由此引发的对电力和散热的苛刻要求更加让人咂舌。数据显示,2023年1月,ChatGPT一个月消耗的电力可能等同17.5万个丹麦家庭的全年用电量。此外,谷歌的大模型每年耗电量高达2.3太瓦时,已相当于美国亚特兰大所有家庭1年的用电量!
坊间传闻,如此巨大的耗电量甚至使得美国的云服务商们尽管明知会面临异地数据传输的巨大困扰,也只能采取分布式部署的方式将生成式AI的服务器集群分布在不同的地区,以避免供电超载。更为夸张的是,据咨询机构Tirias Research建模预测,到2028年,数据中心功耗将接近4250兆瓦,比2023年增加212倍,数据中心基础设施加上运营成本总额或超760亿美元。
这也难怪有人戏称,按照这种趋势,生成式AI的尽头或许将是自建核电站。
不断提升每单位的性能和能效比才是解决问题的根本方法。NVIDIA在本次GTC上发布的B100(代号Blackwell)GPU在AI推理性能比前一代的H100提升了30倍,而能耗却降低到原来的1/25,对于AI和计算领域来说都是一个巨大的进步。
如果这样不够直观,下面的对比可能更容易理解:以训练1.8万亿参数GPT模型的资源消耗为对比,需要用到8000张上一代顶级的Hopper架构加速卡,需要耗能15兆瓦,耗时90天;但在同样90天的前提下,只需要2000张使用Blackwell架构加速卡,且电力消耗只有前者的1/4即可搞定。
从2016年至今,NVIDIA在8年间推出了5代针对AI的GPU,实现了1000倍的AI算力提升,早就跑赢了半导体行业著名的摩尔定律,也为生成式AI的大热奠定了基础。
除了硬件上的提升,NVIDIA还持续在软件方案上进行迭代优化。要知道,全球能够提供AI算力的硬件方案商并不只有NVIDIA一家,其在图形加速领域的老对手AMD同样可以提供相当有竞争力的硬件产品。但若论起相应的AI软件生态,NVIDIA精心打造多年的CUDA已经成为了AI事实上的生态标准。
事实上,比起硬件,AI软件生态才更像是NVIDIA不可逾越的护城河。
从AI影像开始起步,NVIDIA一直在不断完善其在医疗AI领域的软件解决方案,在本次GTC上,NVIDIA又发布了20多项NIM微服务,覆盖医学影像、医疗科技、药物研发和数字健康等领域。它将行业标准API、特定领域代码、经过优化的推理引擎等AI开发所需的内容打包到微服务中,从而可以简化生成式AI开发,并将部署AI的时间从传统的数周大幅缩短到几分钟。
简单来说,这一微服务与软件开发中流行的低代码方式颇为类似。如果没有特别的要求,用户完全不需要从零开始编写代码,开发团队大可以利用现成的NIM微服务进行调优、训练并部署,即可构建出个性化的生成式AI。
借助这些软硬结合的方案,NVIDIA已经从两个方面为即将到来的生成式AI时代做好了准备:硬件上不断迭代,提供更高性能和更优化的能耗水平,软件上则加以多项优化,方便用户落地应用生成式AI。
生成式AI大普及的时代正在加速到来。
积极对外合作投资生成式AI,新药研发成为重中之重
NVIDIA对于生成式AI的看重并不光体现在软硬件的优化上,它还通过与第三方的合作和投资,亲自下场加速生成式AI的实际落地,新药研发则是其中最为重要的一环。在本次GTC上,NVIDIA就和诺和诺德合作打造Gefion超级计算机,可供丹麦公共和私营部门的研究人员使用发现新的药物和治疗方法。
在很多场合,AI制药被视为提升新药研发效率的终极解决方案。尤其在完成发现新靶点、筛选化合物这两件极繁琐却极重要的工作中被寄予厚望。
在新靶点方向上,药企希望依托AI制药强大的计算、分析能力来发现并充分挖掘难成药靶点的潜能,绕开同质化的红海竞争。数据统计,在人类蛋白质组中,难成药靶点占了75%以上,一半以上的人类疾病,在临床上尚无药可医。
靶点确认是药物开发中的关键步骤,也是最复杂的步骤之一。现阶段,被用于新药研发的大多数靶点是蛋白质。在基于AI的靶点发现中,研究者首先从蛋白质的序列、结构、功能中提取原始特征,随后通过机器学习的方法,构建准确、稳定的蛋白质模型,最后用这一模型进行靶点功能的推断、预测和分类。这已经成为AI靶点研究的重要手段。
在筛选化合物方面,除了结构学数据外,AI还可以从患者的样本即海量的生物医学资料中提取基因组学、蛋白质组学、代谢组学等多组学数据,借助深度学习来分析非疾病和疾病状态之间的差异,也可用来发现对疾病有影响的蛋白质。
此外,AI技术还可以简化药物筛选、合成,降低成本。对于筛选出来的化合物,往往还需要进行溶解度、活性/选择性、毒性、代谢、药代动力/药效以及可合成性等维度条件。这将涉及反复多次的实验过程,费时费力,抬高临床前研究成本。而这种高度重复、涉及大量计算的工作,正是计算机程序所擅长。
在这个过程中,AI技术用来实现分子生成,即让机器学习的方法来产生新的小分子。具体而言,AI可以通过对海量的化合物或者药物分子的学习来获得化合物分子结构和成药性方面的规律,进而根据这些规律生成很多自然界从未存在过的化合物作为候选药物分子,有效构建拥有一定规模且高质量的分子库。
此外,AI技术还被用来完成化学反应设计和化合物筛选。目前,AI正在取得进展的化学领域之一是对化学反应和合成路线进行建模和预测。基于AI技术,将分子结构映射为可以由机器学习算法处理的形式,根据已知化合物的结构,形成多条合成路线,并推荐最佳合成路线。反过来,在给定反应物的情况下,深度学习、迁移学习可以预测化学反应结果。AI技术甚至还可用来探索新的化学反应。在化合物筛选中,AI技术被用来对化合物的化学结构与生物活性之间的关系进行建模,预测化合物的作用机制。
随着探索的深入,行业逐渐发现,生成式AI不光可以在“AI预测”环节发挥作用,在实验上同时引入AI,构建“AI预测+实验验证”的方法加速新药研发可能是更为有效率的一个方向。从基于药企实验室的数据、临床数据、理想生物学模型做相对割裂的独立开发,向上游回溯,用数学方法尝试从生物学视角解构疾病机理,以终为始地去找寻药物。
这个过程会涉及比以往更庞大的数据分析及计算,这也是NVIDIA这样具备掌控算力的企业深度参与其中的重要原因。
此外,NVIDIA还试图通过生成式AI来解决实验验证的难题。为此,它推出了BioNeMo,通过提供创新的计算方法可以减少实验,甚至在某些情况下可以完全取代实验。在本次GTC上,NVIDIA持续对BioNeMo进行升级,可加速蛋白质结构预测、生成化学和分子对接预测的基础模型。利用这些功能,药企可以更好地理解和设计药物分子,并减少对时间和资源消耗较大的物理实验。
除了合作,NVIDIA在最近一段时间以来也通过投资在生成式AI产业领域直接下场。
在以往大多数时候,NVIDIA在投资方面主要依靠“NVIDIA初创加速计划”,一面提供GPU、AI开发平台支持,降低AI研发门槛,为AI领域的创业者们提速;一面将自己的软硬件解决方案与创业公司深度绑定,不断拓宽自己的生态底盘。
但在2023年,NVIDIA一改这种略显保守的稳健风格。旗下风投机构NVentures在一级市场异常活跃,共计出手35次,约为2022年的6倍。其中,超半数标的为NVentures领投,显示了其投资策略开始转变,希望通过承担更多风险换取行业的加速发展。
尤其值得一提的是,涉及医疗AI的13个项目中,除了医疗影像和互联网医疗各有2项外,其他9个项目均为新药研发。
2023年NVIDIA投资AI企业不完全统计(标红为医疗企业)
这也体现了NVIDIA对于生成式AI的看好。毕竟,新药研发是生成式AI目前最被看好,也最可能出现颠覆式进展的领域之一。尽管目前还没有生成式AI发现的新药问世,但一旦成功,提前布局并深入其中的NVIDIA在其中将会取得什么样的地位可想而知。
这也难怪,医疗健康能够在今年的GTC中首次站在“C位”。
除了新药研发,NVIDIA也没有忽视生成式AI在医疗其他细分领域的潜在空间。比如,器械巨头强生医疗和GE医疗就与NVIDIA达成合作。前者将利用NVIDIA IGX边缘计算平台和Holoscan边缘AI平台加速和扩展外科手术中的AI应用,后者则将利用NVIDIA AI技术开发可分割超声波图像的研究模型SonoSAMTrack。
此外,NVIDIA还与专注医疗大模型的Hippocratic AI进行深度合作。无论是在黄仁勋的主题演讲,还是NVIDIA医疗业务全球副总裁Kimberlly Powell的主题演讲中,Hippocratic AI基于生成式AI的健康助理都有着相当高的出镜率。这一健康助理可以通过对话向患者实时提供医疗建议,每小时成本仅有人工助理成本的十分之一。
假以时日,生成式AI将会在越来越广泛的医疗场景中成为重要的基础能力,正如当下的“水电气”。
写在最后
通过内部软硬兼施的升级,以及外部合作投资,NVIDIA正不断扩展新的生成式AI应用场景,并推动这一行业更快成熟。尤其在药物研发领域,生成式AI预期将极大地提升药物研发的效率。
正如Kimberly Powell在其演讲上所强调的那样,“医疗行业正在采用生成式人工智能,成为最大的技术产业之一”。从传统医药巨头到初创企业,越来越多的全球医疗企业也正选择NVIDIA加速计算平台来提升AI生产力,降低研发成本。在NVIDIA们的不断努力下,AI算力真正成为数字时代“水电气”的那一天也终将到来。