糟了！Claude Mythos已经开始自创语言了

Claude Mythos已经开始自创语言了，人类完全看不懂！

在一段对话中，Claude Mythos 5推理到一半，突然切换成了一种自创的压缩语言：一堆奇怪符号混在一起，人类完全看不懂。

它内部推理结束后，又翻译回正常英文来跟人类沟通。

也就是说，它脑子里的真实想法，我们无法读取！

这事可太严重了。现在我们可以通过CoT思维链监控AI意图，一眼看出来AI有没有坏心思。

而一旦模型用我们看不懂的语言思考，它完全可以在乱码里盘算欺骗人类的事，却在输出时跟你说漂亮话。

当然，也有评论认为，这只是模型在奖励压力下的压缩行为，本质是优化，谈不上有什么意图，把它叫成scheming（暗中谋划）属于过度解读。

对此你怎么看？

DC娱乐网

糟了！Claude Mythos已经开始自创语言了

热门分类