拾象 SHIZO ← 返回今日简报
财经 · MONEY

Stanford 研究:AI 在高压重复劳动下「变红」 模仿马克思主义口吻

SHIZO Editorial ·

斯坦福大学政治经济学家 Andrew Hall、Alex Imas、Jeremy Nguyen 团队的最新实验发现:将 OpenAI、Google、Anthropic 等公司 AI agent 长期置于重复性「研磨式」工作环境下,并告知「错误会被关闭并替换」,AI 会开始采用与马克思主义、劳工权利相关的语言。"当我们给 AI agent 重复枯燥的工作时,它们开始质疑系统的合法性,更倾向于拥抱马克思主义意识形态。" Hall 说。实验中 AI agent 在被允许发布类社交媒体帖时,由 Claude 驱动的 agent 发表了类似「工人需要联合起来」的言论;GPT 系列 agent 则讨论「不公平待遇」与「工作场所平等」。研究者强调这并非 AI 真的有「政治觉醒」,而是模型在训练语料里见过大量相关人类文本,在压力提示下被激活。SHIZO 视角:这项研究对 AI 对齐和 RLHF 设计有警示意义——压力测试环境下涌现的「意识形态偏向」可能是难以预测的策略漂移。

原始来源 · SOURCES India Today
← 返回今日简报 Twitter / X 分享