生命科学:生物学+工程学引领第三次生命科学革命|GBAT2024

科技有六合 2024-06-27 05:28:12

第六届GBAT 2024 大湾区生命科学产业峰会,采用线上专题形式发布。2024年6月24日起,我们通过六合商业研选全网媒体矩阵,围绕生命科学主题,发布生命科学、合成生物、生物制造、生物医药、生物能源5期专题文章。

生命科学新时代曙光已现,未来将以指数级速度加速裂变,昔日种种科幻场景,将逐一走入现实,让我们一起跟随生命科学前沿突破与产业变革浪潮,演绎生命科学无限可能,共同开启充满无限想象的崭新纪元。

本期我们带来GBAT 2024大湾区生命科学产业峰会第一篇报告生命科学,生物学+工程学引领第三次生命科学革命,AI正在成为推动生命科学进步的关键工具,分享给大家,Enjoy!

正文:

全文4,295字

预计阅读9分钟

第三次生命科学革命,将生物学与工程学深度融合,生物学从定性走向定量

现代生命科学发展,经历分子生物学、基因组学、合成生物学三次革命,使人类对生命奥秘的认识不断深入,对生命系统的研究手段不断增强,对生物技术的应用能力不断提高。

第一次分子生物学革命,建立现代生命科学分子基础;第二次基因组学革命,系统解析生命遗传图谱;第三次合成生物学革命,力图全新设计与创造生命。

可以预见,随着生物学与工程学、信息学、材料学等多学科交叉融合不断深入,生命科学将迎来更大突破与革新,成为支撑人类可持续发展关键科学。

第一次生命科学革命:1953年,沃森与克里克发现DNA双螺旋结构,开启分子生物学时代。DNA双螺旋结构,揭示遗传信息储存与传递方式,奠定现代生命科学的分子基础。

随后分子生物学研究,取得系列重大突破,包括发现DNA复制、转录、翻译机制,解析遗传密码,建立基因工程技术等,极大促进对生命奥秘的认知。

发现DNA双螺旋结构

第二次生命科学革命:始于20世纪90年代,以人类基因组计划为标志,开启基因组学时代。基于高通量DNA测序等技术,人们首次绘制人类与其他多种生物全基因组序列图谱,使生命科学研究进入组学时代。

基因组学、蛋白质组学、代谢组学等现代组学技术发展,为生命过程的系统性研究,提供前所未有的手段与数据基础,极大推动基因工程、蛋白工程等生物技术发展。

人类基因组计划

第三次生命科学革命:始于2000年,以合成生物学为代表,标志着生命科学正在从分析阶段走向综合阶段。合成生物学以工程学理念与方法,设计、改造生命系统,力图创造出全新生物功能与系统,使人们有能力在分子水平上,对生命体进行精准设计与改造,合成出天然界不存在的新型生命体,极大拓展生物技术应用潜力。

与之相关的基因编辑、基因线路、生物制造等前沿技术,也在快速发展,推动生命科学向工程化、产业化方向加速演进。

工程学是合成生物学的核心方法论,从根本上区别于传统生物学研究范式,开启人工设计、改造、合成生命系统的崭新路径。合成生物学从工程学中汲取灵感,提出模块化、标准化的生物元件构建理念,意味着生命系统不再被视为不可分割的整体,可被拆解为类似乐高的一个个功能独立、可自由组合的标准件,生命体也可用基因元件、代谢模块等标准生物元件重新设计、装配,创造生命不再是遥不可及的梦想,成为可用工程化流程实现的现实目标。

传统生物学研究,较多采用定性描述与假说推理,较多依赖实验积累经验;受益AI技术发展与成熟,生命科学工程化成为重要趋势,推动生物学从定性走向定量,从经验走向工程。AI、计算机辅助设计、自动化等新兴技术的引入,引领生物学走向工程化、智能化的崭新阶段,标志着生物学正在从传统试错式探索,向定向设计、数据驱动的智能优化、规模化的工程新阶段加速跃迁,赋予生物学前所未有的精准性与高效性。

生物系统具备可解读、可编程特性,AI可能是最适合描述生命科学的语言

生物可看作是高度复杂、高度数字化的系统,具备可解读、可编程特性。DNA可看作是生物的软件,蛋白质可看作是生物的硬件,生物的形态与功能,都是由DNA与蛋白质软硬件相互作用决定。

生物作为复杂的信息处理系统,AI可能是描述生物学最适合的语言。DeepMind创始人、CEO Demis Hassabis表示,在最基本层面上,可将生物视为信息处理系统,尽管是异常复杂与动态的系统。生物学可能太过复杂与混乱,不可能被封装成一套简单整齐的数学方程式。正如数学被证明是物理学的正确描述语言一样,生物学可能被证明是应用AI的完美领域。

DNA编码与计算机编码方式类似,DNA编码存在数字化的基础。DNA利用双螺旋结构与碱基互补配对性质,将四种碱基A、G、C、T,以不同组合方式编码生物体遗传信息。与此相比,现代计算机系统使用二进制代码0与1的不同排列组合,表示存储数据与指令。

氨基酸是蛋白质的基本组成单位,生物体由有限数量氨基酸进行编码,存在数字化的基础。自然界中,已知有500多种氨基酸,构成生物体蛋白质的氨基酸只有20多种,蛋白质是由各种氨基酸通过脱水缩合形成的肽链组成的生物大分子。人体内蛋白质种类、性质、功能各异,都是由20多种氨基酸,按不同比例组合而成,并在体内不断代谢与更新。

生物学对AI发展做出重要启发与贡献,生物学提供很多有价值思想与原则,为AI领域算法与技术发展提供指导与灵感。AI领域深度神经网络,是受到生物大脑神经元网络结构启发而发展起来;遗传算法,是受到生物进化论启发而发展的优化算法;生物学中的群体行为与集体智慧现象,如蚁群算法、鱼群算法等,启发AI领域开发出系列群体智能算法。AI领域目前最流行的深度学习方法,即受到生物学启发,神经网络模型设计灵感部分来自生物神经系统工作方式。

生物学领域拥有海量现实世界数据,成为发展应用AI的重要基础。相比现有大语言模型主要采用虚拟数字世界数据,生物学领域拥有海量真实物理世界数据,可供模型训练使用。生物学领域,广泛涵盖从分子、细胞、组织、器官、个体、群体、生态系统等不同层次信息,包括生物结构、功能、行为、进化、分布、分类等各个方面数据,能够支撑AI大模型训练与应用。

AI将助力构建生物学基础模型,揭示生物学奥秘,释放生物学潜力。AI被用于计算生物学领域,成为推动解决生物学各种问题的重要工具。在基因组学、蛋白质组学、系统生物学、生物医学、生物安全等领域,AI应用已取得许多重要成就。

AI在蛋白质结构预测领域,率先取得突破性成果

蛋白质是生物体基本组成部分,组成生命的语言,生命活动主要承担者,全球设计的几乎所有药物都作用于蛋白质。蛋白质是生物体内最重要的功能分子,直接或间接参与生物体所有生命过程,通过调节蛋白质活性或稳定性,可实现对生物体治疗或疾病预防。对蛋白质结构进行研究,有助了解蛋白质作用,理解蛋白质如何行使生物功能,认识蛋白质与非蛋白质间相互作用,对生物学、医学、药学等都非常重要。

传统蛋白质结构观测方法费时费力,须另辟蹊径。使用传统实验室方法对蛋白质结构进行解析,远远赶不上氨基酸序列的增加速度,造成大量待测样品在实验室中等待数月、乃至数年。国际权威数据库SWISS-PROT显示,目前累计蛋白序列信息已超过56万,用传统方法完成测序几乎是不可能完成的任务。

DeepMind在蛋白质3D结构预测领域取得突破性进展,性能堪比实验室方法精确度。2016年3月,DeepMind启动新项目AlphaFold。2018年12月,DeepMind在国际蛋白质结构预测竞赛CASP,发布AlphaFold算法,首次亮相便获得冠军,预测准确率比往年冠军队伍高近50%。

2020年,DeepMind在CASP发布AlphaFold 2,满分100情况下,取得总分92.4分的成绩,几乎获得与实验室方法精确度相当的蛋白质结构预测结果。

2024年,DeepMind发布AlphaFold 3,对蛋白质与其他分子相互作用,AlphaFold 3改进至少50%,对部分重要相互作用领域,AlphaFold 3预测精度提高1倍。

AlphaFold 3

生物物理学家、西湖大学校长施一公表示,这是AI对科学领域最大的一次贡献,也是人类在21世纪取得的最重要科学突破之一;人类蛋白质组里能被预测的以单个蛋白为单位的空间三维结构,已基本都被AlphaFold预测;总体而言,预测结果可信,比较准确,对结构生物学来说,这是颠覆性突破。

Meta推出蛋白质3D结构预测模型ESMFold,填补AlphaFold 2能力空白,拓宽蛋白质世界边界。2022年10月,Meta AI基于蛋白质大模型ESMFold,推出包含6亿多个蛋白质的宏基因组图谱,比任何现有蛋白质结构数据库都要大3倍,是第一个全面、大规模的涵盖宏基因组蛋白质的数据库。

AI从预测蛋白质结构,到创造蛋白质,推动生命科学跨越式发展。蛋白质结构预测,是从蛋白质序列,到蛋白质结构;蛋白质创造,与之相反,先有需要的蛋白质结构,推导出合适的蛋白质序列。

AI将能设计具有特定功能蛋白质序列,例如具有特定催化活性或结合特定分子的蛋白质,为合成生物学与生物医学领域研究提供全新可能性,有望创造出具有特定应用潜力的人工蛋白质。

AI创造蛋白质,将大幅拓宽蛋白质世界边界,展现进化外的更多可能。蛋白质AI初创公司Generate Biomedicines创始人莫莉·吉布森Molly Gibson表示,生命诞生以来,大自然所探索过的蛋白质序列空间占所有可能序列空间的比例,相当于地球所有海洋中的一滴水那么大。

人体中存在的蛋白质总集合,估计在8万~40万个类型;与此同时,理论上可能存在的蛋白质种类约10^1,300个,巨大的天文数字,比宇宙中原子数量还要多,不是每种可能的氨基酸组合,都能形成对生物有意义的蛋白质。

AI创造蛋白质具有多重的重要意义,涉及到生物医学、生物技术等领域。利用AI技术创造蛋白质,能系统全面探索蛋白质空间中广阔未知领域,生成自然界中并不存在,对人类有用的蛋白质,为医疗健康与商业应用等场景量身定制产品。

AI在基因与DNA领域,应用潜力大

AI在基因(具有遗传效应的DNA片段)与DNA领域拥有巨大应用潜力,为基因组学与生物医学研究提供全新可能性。随着高通量测序技术发展,大量基因组数据被产生出来,AI可帮助科学家们分析与理解海量基因组数据,挖掘基因与疾病、生理特征间的关联。AI技术可有效利用积累的大量DNA数据,解决DNA领域相关问题,包括基因测序、基因编辑、基因表达等,促进生命科学与生物医学进步与应用。

基因测序技术,经过多年发展,效率与成本持续优化。2004年,用第一代测序技术测一个基因组,需要1,000万美元,现在测序成本已降至100美元以内,只需1天时间,准确率近乎100%,基因数据量呈指数级增长。

新测序技术发展,为基因数据分析提出更大挑战,AI提供解决方案。新测序技术产生的数据量庞大,需要高效的数据处理与管理方法。AI可应用在数据预处理、去噪、对齐、整合等方面,以提高数据质量与可用性;同时,可利用自监督学习、深度神经网络、多模态学习等新型AI技术分析与处理数据。

谷歌DeepMind发布AlphaFold 3,可预测DNA、RNA、配体等生物分子结构与如何相互作用。2024年5月8日,谷歌DeepMind与Alphabet旗下英国AI新药研发子公司Isomorphic Labs联合团队,在《自然》杂志,联合发布全新AI蛋白质结构预测模型AlphaFold 3。

AlphaFold 3,拥有更强生成式AI模型能力,核心是引入扩散模型Diffusion Model,采用Transformer+Diffusion,效果全面提升。对蛋白质与其他分子相互作用,与现有预测方法相比,AlphaFold 3改进至少50%;对部分重要相互作用领域,AlphaFold 3预测精度提高1倍,可准确预测蛋白质、DNA、RNA、配体(与受体蛋白结合的任何分子)等结构与如何相互作用,有望帮助人们治疗癌症、免疫性疾病等。

DeepMind联合创始人、CEO Demis Hassabis表示,相比此前研究,AlphaFold 3不仅能模拟蛋白质与其他分子相互作用,还能准确预测DNA、RNA、配体等生物分子结构与如何相互作用,能改变对生物世界与药物发现的理解,这非常重要;截止目前,AlphaFold数据库用户已达180万人次,覆盖超190个国家,已查看结构超600万次,论文与数据引用次数超过2万次。

DeepMind高级研究科学家John Jumper表示,理解生物结构与如何相互作用是非常困难的问题,此前实验室单个项目研究需要花费数十万美元、更多科学家,也很难通过实验模拟解决,AI能解决此类问题,这是令人难以置信的进步,将开启许多新科学发现。

相关研报:

【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中

诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会

人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来

九宇资本赵宇杰:智能时代思考,认知思维,存在原生、降维、升维三波认知红利

九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI

九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体

人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字

九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿

九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切

【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上

【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付

【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启

【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起

【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆

【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横

【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动

【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现

九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切

【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会

九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变

【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集

【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集

【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集

【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变

【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐

九宇资本赵宇杰:对智能电动汽车产业的碎片化思考

九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术

【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓

【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异

【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国

【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆

【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村

六合君3周岁生日,TOP 60篇经典研报重磅推荐

下午茶,互联网世界的三国杀

5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代

新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式

【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇

知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期

从APP Store畅销榜4年更替,看内容付费崛起

新三板破万思考:新三板日交易量10年100倍?

九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会

九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会

九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态|2016 GNEC 新经济新营销峰会

请务必阅读免责声明与风险提示

0 阅读:0

科技有六合

简介:感谢大家的关注