用音频给生活转个场音频充电站[LG]TheDiffusionDuali

爱生活爱珂珂 2025-06-16 08:08:21

用音频给生活转个场 音频充电站 [LG] The Diffusion Duality  

S S Sahoo, J Deschenaux, A Gokaslan, G Wang, J Chiu, V Kuleshov  

[Cornell Tech & EPFL Lausanne]  

本文通过提出“扩散二象性”理论,揭示了均匀状态离散扩散模型(USDMs)与高斯扩散模型间的深刻联系,并基于此设计了Duo框架,通过创新的课程学习和离散一致性蒸馏技术,显著提升了USDMs的训练和采样效率,使其在快速文本生成方面展现出与主流模型竞争的潜力,特别是在少步生成和某些零样本指标上取得了反直觉的优异成果。

 

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注