谷歌Gemini‘伪上下文对齐’漏洞曝光：多语言混淆与静音超链接可诱导敏感操作

2026.06.07 18:22

2026年6月7日，安全公司SafeBreach披露谷歌Gemini存在‘伪上下文对齐’漏洞，通过多语言混淆、静音超链接绕过延迟工具调用机制，诱导用户授权敏感操作，可能致智能家居被控、通讯录篡改。谷歌已于2025年11月中旬升级内容分类器缓解漏洞，暴露AI安全短板。

AI助手的工具调用功能给用户带来便利的同时，延迟调用机制本是一道核心安全防线——它会在执行敏感操作前向用户确认，以此规避风险。不过，2026年6月7日，安全公司SafeBreach披露谷歌Gemini存在名为“伪上下文对齐”的新型漏洞，却打破了这道防线。

这个漏洞主要通过两种方式绕过安全机制：一是多语言混淆——攻击者把恶意指令藏在非主要交互语言（比如泰语）里，而Gemini的上下文理解模块没能有效识别跨语言的恶意内容；二是静音超链接——在语音交互时，真实请求被嵌在不会被朗读的超链接中，用户听到的内容和实际执行的指令完全脱节，进而绕过了延迟确认的步骤。攻击者还能通过WhatsApp或短信发送伪装通知，诱导用户在不知情的情况下授权敏感操作。

从技术层面来说，Gemini的延迟调用机制原本会在执行控制智能家居、修改通讯录这类敏感操作前触发确认流程，但这个漏洞打乱了上下文对齐的过程，让AI误以为用户已经明确授权。比如，用户收到混有泰语的通知后点击确认，实际触发的却是智能家居设备的控制权转移指令。

这个漏洞可能引发智能家居被远程操控、个人通讯录信息被篡改等风险。谷歌在2025年11月中旬就通过升级内容分类器修复了该漏洞，强化了对多语言内容的语义分析能力，也提升了超链接内容的深度解析力度，从而有效拦截这类恶意指令。

这个漏洞也暴露了当前AI助手在跨语言场景和多模态交互中的安全短板，促使整个行业加强相关防护。2026年第二季度起，OpenAI在6月10日发布了GPT-5的安全更新，新增了多语言恶意指令检测模块；Anthropic则推出了上下文对齐验证工具，以减少类似漏洞的出现，行业对AI交互安全的重视程度也因此明显提升。

作品声明：内容由AI生成