谷歌的超快文本生成新技术——GeminiDiffusion，实际就是把扩散模型

量子位来谈科技 2025-05-23 19:15:00

谷歌的超快文本生成新技术——Gemini Diffusion，实际就是把扩散模型用到了文本生成上。那么，扩散模型（Diffusion model）和传统自回归模型（Autoregressive model），在生成机制上有什么差异？核心就在于，扩散模型不是“一个字一个字”地生成，而是一次性生成完整的结果，然后不断修正（像是从马赛克一步步清晰化）。这意味着： - 多个正确的 token 可以并行出现，速度自然快； - 可选择少做几轮修正，牺牲点质量来换更快输出。但如果你只想生成几个token，扩散模型反而更慢。毕竟它无论长短都得跑完整套流程。而自回归模型可以灵活停下。还有个差异就是输出长度：扩散模型一次只能输出固定长度（如256个token），要更长就得再来一轮；自回归模型则可以随时停。这也影响了两者在长上下文的表现，扩散模型一旦开始就要跑完一轮，长上下文处理成本更高。那它能“推理”吗？现在很多强模型靠“思维链”（COT）提升推理能力，而在COT中，自回归模型每一步都可以“反悔”，如“等等”或者“我错了”。扩散模型因为是整块生成+迭代修正，类似“我错了”的中途反应，可能会在后续迭代中被抹掉。当然，也有研究试图让扩散模型具备类似能力，但目前还没看到特别惊艳的效果。最后还有一个小点：虽然叫“扩散模型”，它内部其实也用到了Transformer架构，只是作用不同：不是预测下一个token，而是判断哪里是“噪声”需要被修正。总结一下，扩散语言模型的优劣很明显： - ✅ 并行生成，速度快，适合追求高吞吐； - ✅ 可调节精度与速度的平衡； - ❌ 上下文长时效率低； - ❌ 推理能力尚不明确； - ❌ 小规模生成不占优势。对此，有网友表示，未来或许是两种模型“分工合作”而不是“谁取代谁”。感兴趣的小伙伴可以点击原文：-of-text-diffusion-models/

0 阅读：1

量子位来谈科技

感谢大家的关注

作者最新文章

1

社交平台Discord，公开了迄今为止规模最大的聊天记录数据集——Discord

2

天气虽难以操控，但距离精准预测又更近了一步！微软研究院推出的地球系统基础模型A

3

三人行，必有我师焉！模型也能通过“学习”不断进步。蒸馏就是一种能让小型AI模型

4

豆包支持生成播客了！俩AI“主播”甚至有咽唾沫、停顿和抑扬顿挫。听完只感觉，这

5

美团发布了AI编程平台“NoCode”，主打AI开发网页。用户可通过自然语言交

6

谷歌发布了支持手机部署的AI模型，仅占2GB内存，还支持推理。在2025年5月

7

OpenAI更新Responses API，支持七项新工具！开发人员现在更轻松

8

谷歌扩大了AI概览广告的投放范围，还计划在AI模式里也来点广告！先带不熟悉的朋

9

都说AI耗电，具体有多耗呢？据美国劳伦斯伯克利国家实验室估算，到2028年，仅

10

这个网站非常有意思——全世界人此时都在干嘛？此时此刻，有多少人在睡觉、上班、吃

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米又搞大动作啦！6月24日雷军透露小米YU7支持车外小爱语音。车外配备8个麦克

2

一图解读：十款手机配置，各显神通，你更喜欢哪款？

3

4K手机推荐指南，零差评体验！

4

关于华为Pura80全系芯片的真机实测已经出来了，确认为Mate70同款的麒麟9

5

左边是我花了5499国补价买到的iPhone16Pro，右边是苹果直营店里

6

疯了！一夜之间360的市场部员工天塌了！老板周鸿祎半夜发微博，准备干掉3

7

同是骁龙8Gen3，荣耀400Pro还是荣耀Magic6荣耀Magic6和

8

华为官网公布了HarmonyOS5.1系统升级计划。适配范围覆盖旗下全系列重磅

9

拿到Pura80ultra后迫不及待和mate70pro+进行对比图1图2主摄

10

Pura80小艺具备AI视觉能力看完Pura80发布会，最深刻的印象就是——

科技最新文章

1

小米又搞大动作啦！6月24日雷军透露小米YU7支持车外小爱语音。车外配备8个麦克

2

华为Mate80真的要炸场了！据爆料，它有太多令人尖叫的亮点。芯片是麒麟902

3

华为nova15惊艳曝光：1.05窄边框+鸿蒙6，满分答卷！这款华为nova15

4

我问了做鸿蒙开发的程序员同学，HarmonyOS6到底强在哪。他敲着代

5

雷军这波被卡脖子了。他怎么也不会想到，华为刚开完鸿蒙生态会，技术授权名单

6

我问了参与鸿蒙开发的工程师，余承东演讲时小艺实时生成字幕怎么做到的。

7

荣耀虽然没有明说，但是估计大家早已经心知肚明当荣耀MagicV5开始官宣的时

8

红米K80至尊版对比K80ProPro只要两千多，假设K80至尊版是

9

万万没想到，华为mate70pro居然还有鼎桥版。今天，我在某二手平台上逛，

10

正式官宣！荣耀MagicV5发布会定档，配置全面曝光搭载骁龙8至尊版、