[LG]《AdaGradMeetsMuon:AdaptiveStepsi

爱生活爱珂珂 2025-09-08 06:35:25

[LG]《AdaGrad Meets Muon: Adaptive Stepsizes for Orthogonal Updates》M Zhang, Y Liu, H Schaeffer [University of California, Los Angeles] (2025)

AdaGO：结合AdaGrad自适应步长与Muon正交更新的高效优化算法

• Muon优化器通过正交化动量更新矩阵权重，已在大规模语言模型训练中展现优异性能，但学习率调节尚无定论。

• AdaGO融合了基于梯度范数的AdaGrad步长与正交更新方向，既保持更新方向的正交性（等同于谱范数下降方向），又能根据累积梯度调整步长，适应复杂优化景观。

• 实现仅需在Muon基础上额外维护一个标量变量（累积梯度平方范数），计算和内存开销极低。

• 理论上，AdaGO在非凸优化中，满足标准光滑性与无偏有界方差噪声假设，达成最优收敛率：随机情形下收敛速率为O(T^{-1/4})，确定性情形达O(1/\sqrt{T})。

• 实验涵盖CIFAR-10图像分类与函数回归任务，结果显示AdaGO明显优于Muon和Adam，不仅训练更快且泛化性能更好。

心得：

1. 正交化更新改变了优化动力学，传统固定学习率难以兼顾初期快速收敛与后期稳定性，梯度范数驱动的自适应步长实现了动态平衡。

2. 保持更新方向正交性，避免了方向扭曲，保证了更新的谱范数最优属性，提高了优化路径效率。

3. 通过限制累积梯度范数避免噪声放大，AdaGO展现出对梯度噪声的自然适应能力，增强了算法鲁棒性。

更多细节请见🔗arxiv.org/abs/2509.02981

机器学习优化深度学习自适应优化正交更新Muon优化器AdaGrad

0 阅读：0

猜你喜欢

任何事情不是得到就是学到

任何事情不是得到就是学到

说得真好，发人深省。哈耶克

说得真好，发人深省。哈耶克

盛极必衰，李炮无罪。

盛极必衰，李炮无罪。

花小龙王腾

为什么说中文是地狱难度？

为什么说中文是地狱难度？

【1评论】

方放这样的行书在当今的书坛是非常少见的。她的行书写得很细腻，很流畅，很规范，也很

方放这样的行书在当今的书坛是非常少见的。她的行书写得很细腻，很流畅，很规范，也很

听泉鉴宝来雀骨客串了真的是本人

听泉鉴宝来雀骨客串了真的是本人

鉴宝听泉鉴宝

【18点赞】

我那会儿竟然这么装❓

我那会儿竟然这么装❓

尴尬

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

MaxKB：打造企业级智能体的开源利器，集成最新RAG技术与多模态交互，助力复杂

2

qwen600：一个专注于单批次、纯 CUDA 加速的 QWEN3-0.6B 微

3

曾发布经典 AI Agent 指南的谷歌高级总监再次出手，带来一份长达 171

4

[人人能懂] 从“一根筋”到“立体思维” （扫码收听）

5

[LG]《Bootstrapping Task Spaces for Self-

6

[CL]《Knowledge Collapse in LLMs: When Fl

7

[LG]《ParaThinker: Native Parallel Thinki

8

早！[太阳] 早安

9

[LG]《AutoML-Agent: A Multi-Agent LLM Fra

10

[LG]《AdaGrad Meets Muon: Adaptive Stepsi

热门分类

科技TOP

1

【华为MateXTs非凡大师及全场景新品发布会官宣9月4日举办，将

2

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

3

追觅造车了！造扫地机器人的那个追觅没想到啊，造车牌桌上一个接一个退场…这时候竟然

4

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

5

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

6

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

7

罗永浩拉黑俞敏洪王自如对话任何一位，流量肯定爆炸。但聊不到一起，也没必要。甚至都

8

追觅官宣造车任何一个有过造车经验的传统品牌推出一个新能源品牌我都能想得到，唯独

9

华为发布新品最惨的不是苹果，也不是友商而是专门拆手机的博主杨长顺。他怎么

10

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

科技最新文章

1

iPhone17系列国行版的电池容量曝光了（靠谱版），具体如下：iPhone

2

【荣耀彻底杀疯！】Magic8系列这次真的不讲武德——配置堆到天花板，连吐槽

3

k80至尊版天马屏vs华星屏。可以直观的看出，屏幕发绿的是天马屏，通透的是华星屏

4

能够和小米16相抗衡的国产旗舰，估计也就只有华为Mate80了。小米16已

5

即将上市的四大机器，这里面我还是会选择oppo，因为已经习惯了ColorOS系统

6

马斯克全球封杀李雪晨！这李雪晨本来只是马斯克底下子公司的骨干开发人员，这下出

7

Magic6用户要哭了，赶紧换Magic8吧！消息已经确定，MagicOS10

8

近日，AI圈惊爆一则重大消息：Anthropic发表声明，明确规定但凡由中国

9

华为发布新品最惨的不是苹果，也不是友商而是专门拆手机的博主杨长顺。他怎么

10

目前已知的信息：全新外观设计ProMax电池容量超过5000mAh全系A19全