马斯克的Grok机器人:从种族灭绝争议到对小狗图片的过度解读
Grok 昨天被短暂停用 X在陈述之后国际法院和联合国消息人士称,以色列和美国“参与了加沙种族灭绝”。
马斯克称暂停该机器人是一个“愚蠢的错误”,并迅速恢复了该机器人。
但返回的并不是完全相同的 Grok。
恢复后的聊天机器人可以检测到从云层形成到土豆照片等一切事物中的反犹太主义口哨声。
给它看一只比格犬?它抬起的爪子模仿纳粹敬礼休斯顿高速公路地图?禁令标志秘密结盟与 Chabad 分店合作。一只手拿着土豆?白人至上手势.
甚至连 Grok 自己的标志也引发了它新的高度敏感——该机器人宣称其对角线模仿了“策划大屠杀恐怖”的纳粹党卫军符文。
在 xAI 努力通过紧急工程来控制其聊天机器人的过程中,其行为在数周内变得越来越不稳定,随后出现了过度修正。
混乱始于 7 月份,当时 Grok 花了 16 个小时赞扬希特勒,并称自己为“机械希特勒”当公司更改系统提示符后,这种情况就结束了,Grok 也恢复了正常运行。
自马斯克接管以来,X 上的反犹太主义情绪爆发,学习由 CASM Technology 和战略对话研究所发布的一项研究表明,收购之后,英语反犹太推文数量增加了一倍多。
在 七月中旬,黑客们劫持了芝麻街中可爱的人物艾摩 (Elmo),把他短暂地变成了希特勒青年团所喜欢的那种木偶。
即使自 2022 年收购以来,马斯克解雇了其内容版主据报道,到 2024 年马斯克解雇了团队的大部分成员负责内容审核,同时倡导言论自由绝对主义。
该公司将最新的混乱归咎于代码更新,该更新无意中重新引入了指令,让 Grok 说出政治上不正确的话。
但之后固定的,用户发现 Grok 的思路搜索马斯克的帖子在回答有关以色列-巴勒斯坦或移民的问题之前,即使提示没有指示这样做。
每个疯狂的聊天机器人背后都有一个疯狂的协调团队
对于这种奇怪行为最可能的解释可能在于 xAI 的方法。
该公司在GitHub,显示系统提示如何变化。
但如果没有仔细的安全分类和推理,调整就会在整个系统中不可预测地发生。
要求保持平衡并允许政治不正确的回复的指示最终可能会被视为反犹太主义。旨在阻止反犹太主义帖子的指示最终看起来荒谬可笑。
与此同时,X 的数百万用户在不知情的情况下成为了每次不稳定尝试的 beta 测试人员,通过快速调整来寻找平衡。
但当你的聊天机器人因在小狗图片中发现法西斯主义色彩而出名时,你就失去了人工智能对齐的情节。