[LG]《Foundations of Schrödinger Bridges for Generative Modeling》S Tang [University of Pennsylvania] (2026)
在随机生成建模领域,如何在两个任意概率分布之间构造最优随机路径,始终是一个未被统一回答的难题。扩散模型、流匹配、得分匹配等方法各自成体系,彼此关系隐晦——它们共享某种深层结构,却缺乏一个能将其贯通的数学语言。
本文的核心洞见是:把"在分布间传输概率质量"重新看作"在路径测度空间中做KL散度投影"。由此,薛定谔桥被定义为偏离参考随机过程最小的受控路径:最优控制漂移 u* = σ∇log φt,最优密度 p*t = φt·φ̂t,两个随时间演化的势函数通过线性PDE系统(Hopf-Cole变换后)解耦——这一操作将非线性最优化转化为前向-后向随机微分方程,使得得分匹配、流匹配和随机最优控制均成为其特例。
这项工作真正留下的遗产是:为扩散模型、流匹配、最优传输提供了一个统一的变分原理,使研究者能在同一语言下推导、比较和扩展这些方法。它为后来者打开的新门是:将该框架推广至离散状态空间(CTMC)、非平衡质量传输(非平衡SB)和分支动力学,拓宽了细胞动力学和分子采样等科学应用的建模边界。但尚未跨过的门槛是:高维薛定谔桥的精确求解在计算上仍依赖近似迭代,端点耦合的估计质量直接制约桥的精度,大规模系统的可扩展性尚未完全解决。
arxiv.org/abs/2603.18992
机器学习 人工智能 论文 AI创造营








