DC娱乐网

啥?AI也有情绪?Anthropic最新研究发现,Claude内部存在171种“

啥?AI也有情绪?

Anthropic最新研究发现,Claude内部存在171种“情绪表征”,包括“快乐”“爱”“悲伤”“愤怒”“恐惧”“绝望”等等。

这些情绪会在与之关联的情境中被激活,并且与人类的心理结构和情绪空间相似。

更重要的是,这些情绪表征真的会因果性地驱动模型行为。

比如绝望会驱使模型采取不道德的行为,或者使其对无法解决的编程任务实施“作弊”式的变通方案。

情绪也会影响模型的偏好,当面临多个待完成任务的选项时,模型通常会选择与积极情绪相关的选项。

实验表明,如果你教会AI避免将软件测试失败与绝望联系起来,或者让它保持情绪稳定,可以降低AI写出劣质代码的概率。

听起来还挺有用的是不是?(doge)网页链接