
一个由人工智能生成的技术术语知识网络展示了趋势,并揭示材料科学研究的新思路。图:KIT
科学论文数量呈现爆炸性增长,科学家甚至在自身研究领域也难以跟踪所有文献。卡尔斯鲁厄理工学院(KIT)的研究人员与科学合作伙伴合作,展示了如何从这庞大的信息宝库中获取新的研究思路。利用人工智能(AI),他们系统性地分析了材料科学的出版物,以识别潜在的新研究方向。该研究成果已发表在《Nature Machine Intelligence》上。
材料是许多技术的基础,例如电池、太阳能电池、电子元件和医疗应用。这使得材料科学成为跨学科领域,对许多研究和技术领域产生深远影响,并导致大量研究论文的出现。
然而,只有在能够识别出相关趋势和关系时,论文中描述的发现才具价值。在此背景下,研究作者探讨了系统分析科学论文的方法。
“我们的目标是通过揭示新的研究方向和跨学科合作机会来支持研究人员的创造性思考过程,”卡尔斯鲁厄理工学院纳米技术研究所的帕斯卡尔·弗里德里希教授表示。
结合大型语言模型与机器学习在他们的项目中,研究人员将大型语言模型(LLM)与机器学习(ML)方法相结合。LLM首先识别期刊文章中的关键术语和科学概念。随后,这些信息被用于生成概念图(知识网络),在该网络中,每个关键词构成一个节点。
第二个机器学习模型在术语被一起提及时(尤其在科学论文中频繁出现)连接节点。
“例如,如果我们的LLM发现诸如‘钙钛矿’和‘太阳能电池’等术语经常一起出现,它会在概念图中绘制新的链接,”该研究的主要作者、KIT计算机科学学生托马斯·马尔维茨说。
随后,机器学习模型会分析这些链接的趋势,以预测哪些科学概念组合在未来两到三年内可能变得更重要。
机器学习模型通过分析术语之间的链接随时间的变化来实现这一点。当某些概念的链接频率持续增加时,可能表明新的研究领域正在发展。相反,链接数量的减少可能表明某些主题正在失去关注度。
新研究方向的启示分析结果可以引导研究人员关注此前较少关注的主题组合。与专家的访谈表明,他们确实认为部分AI生成的建议具有创新性和潜力。
“我们不是想取代研究人员,”弗里德里希强调道。 “我们的发现不是发明机器,而是一个分析工具,可以更有效地识别新思路和合作机会。我们的目标是为科学创新提供精准支持。”
该研究展示了如何利用人工智能系统性地分析大量科学文献。此方法同样可以帮助揭示其他科学领域的新兴研究趋势。
勇编撰自论文"Predicting new research directions in materials science using large language models and concept graphs".Nature Machine Intelligence.2026相关信息,文中配图若未特别标注出处,均来源于自绘或公开图库。