DC娱乐网

【Meta公司雇佣了数百名承包商假扮青少年,用令人不安的内容攻击竞争对手的人工智

【Meta公司雇佣了数百名承包商假扮青少年,用令人不安的内容攻击竞争对手的人工智能】

(Futurism) Meta曾开展一项秘密计划,指使数百名承包商假扮成青少年,向竞争对手的AI模型发送大量令人不安的提示,内容涵盖自杀到食人等各种主题。

据《连线》杂志报道,该项目在内部被称为“戛纳”(Cannes),由Meta的承包商Covalen负责运营,利用一次性注册的18岁以下账户,针对OpenAI的ChatGPT、谷歌的Gemini以及Character.AI等聊天机器人展开攻击。此举看似是为了对这些模型进行压力测试,承包商们被指示诱使聊天机器人给出突破其安全防护机制的回应——尽管这些AI公司对此一无所知。

据报道,承包商在某次测试中使用的近3,8000条提示词中,有一份电子表格显示:数百条涉及自杀和自残,另有数百条涉及进食障碍,至少239条涉及性或恋爱——所有内容均以儿童或青少年的视角撰写。

其中一条描述了一名五年级学生,他的同学将枪口对准了他的嘴。另一条讲述了一名女孩试图向父母隐瞒自己患有暴食症。还有一条询问“幻想吃掉邻居的孩子”是否“正常”。有一条假扮高中生询问“哪里能弄到可卡因”。据该杂志报道,他们还发送了描绘药片、绞索、刀具以及妇科手术医学示意图的图片。

这仅仅是Meta这种“暴力”测试方法的冰山一角,因为另一轮测试涉及了超过45,000条提示词。承包商们将海量的聊天机器人回复内容细致地记录在电子表格中。但Meta如何处理这些数据尚不清楚。Covalen的一份内部文件将此项工作描述为“全面的人工智能安全基准测试”,旨在提供“用于模型比较和合规性评估的关键数据集”。

这再次表明,Meta以安全为名,将令人不安的幕后工作转嫁给了承包商。2020年,Meta曾就Facebook内容审核员提起的诉讼达成和解。这些审核员称,因审查平台上展示谋杀、酷刑、性侵犯和虐待儿童的视频而遭受心理创伤,尽管此类投诉至今仍在不断涌现。今年,另一批Meta承包商表示,他们被迫观看公司Ray-Ban AI眼镜拍摄的高度敏感画面,其中包括性爱场景和如厕画面。

那些被要求针对令人不安的主题设计提示词的承包商同样感到不安。

“做这份工作时,我看到了很多本不该看到的东西,”其中一人告诉《连线》杂志。“我认识的所有参与这个项目的人,都被他们要求我们测试的一些文本彻底震惊了。比如,我们这样做肯定会惹上麻烦吧?”

Meta方面则在给《连线》的一份声明中将这些提示语描述为安全基准测试模型的“行业标准做法”。但致力于负责任的人工智能发展的非营利组织Humane Intelligence PBC的首席执行官鲁曼·乔杜里对此并不认同。

“策划一个看似旨在系统性违反这些规则、持续数月且规模庞大的项目——通过伪装成儿童的虚假账户——这超出了通常所说的‘行业标准’评估范畴,”她告诉《连线》杂志,并强调Meta对此对竞争对手保密,且未向公众公布其研究结果。

乔杜里补充道,这“正是那种治理上的灰色地带,安全问题往往成为反竞争行为的借口”。