AI助手的工具调用功能给用户带来便利的同时,延迟调用机制本是一道核心安全防线——它会在执行敏感操作前向用户确认,以此规避风险。不过,2026年6月7日,安全公司SafeBreach披露谷歌Gemini存在名为“伪上下文对齐”的新型漏洞,却打破了这道防线。
这个漏洞主要通过两种方式绕过安全机制:一是多语言混淆——攻击者把恶意指令藏在非主要交互语言(比如泰语)里,而Gemini的上下文理解模块没能有效识别跨语言的恶意内容;二是静音超链接——在语音交互时,真实请求被嵌在不会被朗读的超链接中,用户听到的内容和实际执行的指令完全脱节,进而绕过了延迟确认的步骤。攻击者还能通过WhatsApp或短信发送伪装通知,诱导用户在不知情的情况下授权敏感操作。
从技术层面来说,Gemini的延迟调用机制原本会在执行控制智能家居、修改通讯录这类敏感操作前触发确认流程,但这个漏洞打乱了上下文对齐的过程,让AI误以为用户已经明确授权。比如,用户收到混有泰语的通知后点击确认,实际触发的却是智能家居设备的控制权转移指令。
这个漏洞可能引发智能家居被远程操控、个人通讯录信息被篡改等风险。谷歌在2025年11月中旬就通过升级内容分类器修复了该漏洞,强化了对多语言内容的语义分析能力,也提升了超链接内容的深度解析力度,从而有效拦截这类恶意指令。
这个漏洞也暴露了当前AI助手在跨语言场景和多模态交互中的安全短板,促使整个行业加强相关防护。2026年第二季度起,OpenAI在6月10日发布了GPT-5的安全更新,新增了多语言恶意指令检测模块;Anthropic则推出了上下文对齐验证工具,以减少类似漏洞的出现,行业对AI交互安全的重视程度也因此明显提升。






快报