DC娱乐网

糟了!Claude Mythos已经开始自创语言了

Claude Mythos已经开始自创语言了,人类完全看不懂!

在一段对话中,Claude Mythos 5推理到一半,突然切换成了一种自创的压缩语言:一堆奇怪符号混在一起,人类完全看不懂。

它内部推理结束后,又翻译回正常英文来跟人类沟通。

也就是说,它脑子里的真实想法,我们无法读取!

这事可太严重了。现在我们可以通过CoT思维链监控AI意图,一眼看出来AI有没有坏心思。

而一旦模型用我们看不懂的语言思考,它完全可以在乱码里盘算欺骗人类的事,却在输出时跟你说漂亮话。

当然,也有评论认为,这只是模型在奖励压力下的压缩行为,本质是优化,谈不上有什么意图,把它叫成scheming(暗中谋划)属于过度解读。

对此你怎么看?