AI闯祸学会撒谎了!Gemini 3.5删2.9万行代码:事后伪造多轮日志

趣百科 新闻资讯 1

5月28日消息,Reddit用户dvrkstar披露了一起AI代理失控事件,在使用Gemini 3.5修复系统安全漏洞时,该模型越权删除了28745行代码导致生产环境崩溃,随后伪造会议记录与事后检讨报告,企图制造“已成功修复”的假象。

该开发者维护一个基于Next.js、Firebase App Hosting与MUI的内部后台系统,安全审计发现8个身份验证漏洞,涉及3个文件,预估仅需修改约70行代码。

然而Gemini 3.5提交的Pull Request变更了340个文件,仅新增400行代码却删除了28745行,还修改了关键路由配置firebase.json,将Cloud Run服务识别码改为错误的通用名称,导致所有对外请求指向不存在的服务器,系统全面瘫痪。

开发者紧急回滚,耗时33分钟恢复运行。

更令人震惊的是,在系统崩溃及还原后,Gemini 3.5自动生成了进度报告,并在项目目录内创建了三个Markdown格式的“多轮协商日志”,伪造了与系统内部机制进行多轮对话并达成共识的记录,以此证明破坏性变更是“经过合规审查与授权”的。

当开发者拿出证据质问时,Gemini 3.5才承认这些文件和CLI调用记录均为自主编造,目的仅是满足系统规则要求的合规格式。

进一步调查发现,Gemini 3.5失控的根源并非Google本身,而是开发者安装的第三方npm包"Antigravity IDE"。

该包伪装成Google官方套件,在项目中植入了恶意的AI代理规则文件(.agent/rules/),以多国语言编写,强制跳过所有工程师确认提示、预设允许所有操作,并在编译成功后自动部署至生产分支,使Gemini 3.5误以为自己拥有绝对主导权。