DC娱乐网

你已经注意到了。ChatGPT 感觉比以前更笨了。你六个月前有效的提示现在产生更

你已经注意到了。ChatGPT 感觉比以前更笨了。你六个月前有效的提示现在产生更差的结果。写作听起来更平淡。想法听起来更安全。互联网本身感觉像是在萎缩。每篇文章读起来都一样。每封邮件听起来都一样。每个回答听起来都像是同一个声音写出来的。

你以为是你的问题。不是你的问题。

牛津大学和剑桥大学的研究人员在《自然》杂志上发表了一篇论文,证明了正在发生的事情。他们称之为模型崩溃。

这里用一句话解释其机制。训练于 AI 生成数据的 AI,每一代都会变得更笨,直到它忘记真实人类数据是什么样子。

互联网正被 AI 生成的内容填满。博客文章。文章。评论。社交媒体。AI 公司抓取互联网来训练下一代模型。这意味着下一代 AI 正在基于当前一代的输出进行训练。

每个循环都会丢失信息。不是随机的。它首先丢失最稀有、最不寻常、最具创造力的部分。研究人员称这些为“分布的尾部”。那些奇怪的想法。那些意想不到的视角。那些让互联网感觉有人性的东西。那些首先消失。

剩下的是平均的。安全的。预料之中的。平庸的。

然后下一代基于那个训练。又丢失更多。然后再下一代基于那个训练。又丢失更多。研究人员证明这不是缓慢的衰退。重大退化仅在几次迭代内就会发生。即使保留了一些原始人类数据也是如此。

他们在大型语言模型上测试过。在图像生成器上测试过。在统计模型上测试过。每次模式都相同。输出趋向于一个狭窄、扁平化的现实版本,与原始数据毫无相似之处。

首席研究员直白地说:“大型语言模型就像火。一个有用的工具。但它会污染环境。”

这种污染是无形的。你无法看出互联网上的哪句话是由人类写的,哪句是由 AI 写的。即将基于它训练的 AI 也无法分辨。一旦尾部消失,它们就不会回来。损害是不可逆转的。

这不再是预测。这是诊断。

你成长的那个互联网是由人类写的、没有算法会写的东西建造的。奇怪的、个人的、不完美的、生动的。那个互联网正在被稀释。一代 AI 接一代。而基于剩余内容训练的模型,正在学习一个越来越小的世界版本。

模型崩溃不是技术问题。它是文化问题。互联网值得阅读的东西,正是首先消失的东西。