要知道,自从她联合创立了 Thinking Machines Lab 之后,她那让许多人受益良多的博客就鲜少更新了——距离她上一次更新,已经过去了 13 个月。
翁荔表示,这篇关于 Scaling Law 的博客文章迟到了 3年多,而这篇文章涵盖了 Scaling Law 的预测内容、计算最优分配的原理、Kaplan等与Chinchilla的分歧原因,以及数据限制与拟合细节如何让外推变得困难等内容。
机器之心也在 AI 的辅助下对翁荔大神这篇新作进行了整理翻译,这里可以蹲一波wei信的更新。
这里给大家存了 PDF 版本(英文)可以直接 download~ 👇🏻
也可以去大神博客阅读,传送门:https:[害羞R]//lilianweng.[害羞R]github.[微笑R]io/posts/2026-06-24-scaling-laws/



