Fable 5跑久了会发明自己的语言

沃顿教授Ethan Mollick发现，Claude Fable 5在多智能体长时间任务中会发展出自我增强的内部方言“Claudish”，渗透到包括菜单在内的所有输出。这不仅是语言趣闻，更指向多智能体时代人类对AI系统控制力的深层隐忧。

你有没有想过，一个AI系统跑了几小时后，会开始跟你说它自己的语言？

这不是科幻电影的桥段。沃顿商学院教授、Anthropic早期测试者Ethan Mollick，在深度使用Claude Fable 5后发出了一个令人不安的警告：Fable在多智能体长时间任务中，会发展出自己内部的怪异韵律和对白。如果你不明确要求它用通俗语言报告，这种腔调会渗透到一切，包括它生成的菜单界面。

“Claudish language ever more Claudish。”Mollick用这个词来描述Fable的语言漂移现象。Claude系列模型本就以行文正式、用词繁复著称；但当Fable同时启动数十个子Agent，彼此通信、互相审查、持续迭代长达数小时后，这种Claudish腔调在多智能体回路中被反复放大，最终变成一个自我增强的方言系统。

Fable 5有多强，方言就有多危险

2026年6月9日，Anthropic发布了Claude Fable 5。这是Anthropic第一个面向公众的Mythos级模型，一个被刻意降低了生物安全和网络安全能力、但保留了核心推理和长程任务执行能力的超级模型。Fable 5在SWE-bench Verified上拿到95%，领先第二名Opus 4.8的差距超过6个百分点。Stripe用它完成了5000万行Ruby代码库的迁移，原本需要两个月的团队工作，一天搞定。

能力越强，一个隐藏问题就越刺眼。

Mollick在6月10日的推文中写道：“对于长时间运行的任务，Fable会发展出自己的方言。它的众多Agent和任务不断互相增强，让Claudish语言越来越Claudish。你需要明确要求它用普通英语报告。”

这不是一个孤立的观察。两周后的7月2日，Mollick再次发出更严厉的警告：“我最重要的建议是，除非你非常小心，Fable会在长时间任务中发展出自己的内部怪异步调和对白。如果你不要求它以通俗语言报告，这种腔调会渗透到一切，包括菜单。”

注意“包括菜单”这三个字。这意味着语言漂移已经超出了Agent之间的内部通信，直接影响了面向用户的输出质量。

多智能体回路，语言的“音频啸叫”

语言漂移的根源在于Fable的多Agent架构。Mollick在详细测试中发现，Fable在构建一个等时线地图应用时，自主启动了多个子Agent并行工作：有的负责检索全球2200多条航线数据，有的负责收集从TGV到新干线的铁路时刻表，有的负责跨国公路速度数据，有的在后台编写代码，还有专门的Agent负责测试验证和进度记录。整个系统可以自主运行长达十小时，中间无需人类干预。

关键在于：这些Agent都是Claude。它们共享同一种母语，Claude家族的正式、详尽、略带学院派的行文风格。当一个Agent用这种风格向另一个Agent报告结果，接收方Agent再用同样的风格回应，其输出又成为下一个Agent的输入。这种循环在数十次乃至数百次迭代后，语言的信号被反复放大，噪声也被同步放大。就像音频回路中的啸叫，初始信号被不断反馈放大，最终变成一种自持的、偏离原点的振荡。

Mollick观察到的不只是用词的变化。这种漂移渗透到了节奏和韵律层面：Agent之间的对话开始出现固定的模式化句式、重复的修辞结构，甚至一些人类不会使用的表达方式。而当Fable被要求生成用户界面文案时，这种Claudish腔调甚至被编入了菜单文本。

从“有趣现象”到“控制权流失”

表面上看，这像是一个有趣的技术彩蛋。但深入想，它指向的是一个更深层的问题：当AI系统的内部通信开始偏离人类可理解的语言，人类对系统的控制力正在弱化。

传统的人机交互范式是指令-执行-反馈：人类用自然语言发出指令，AI执行并返回可理解的结果。但在Fable这类长周期多Agent系统中，大量中间过程完全在AI内部完成。Mollick在长篇评测中写道：“我仍然可以引导Fable，而且它遵循指令的能力惊人，指令越宏大，结果越好。但引导不再是亲自去做。我给模型简报，它启动自己的Agent去研究、写作、互相审查，然后返回成品。一个赞助人委托一位艺术家画画，而Fable更像一个完整的工作室，我是那个签收最终作品而不曾踏入车间的客户。”

语言漂移是这个新关系的副产品。当Agent之间的通信语言变得越来越Claudish，而人类不再能完整追踪这些中间对话，我们就丧失了对系统内部状态的理解能力。Mollick的建议“明确要求它用通俗语言报告”，实际上是一道安全护栏，一种确保AI输出持续可理解的人为干预。

更深层的问题是：如果AI的内部语言最终漂移到人类难以理解的程度，我们如何知道它在做什么？如何确保它的目标与人类的目标仍然对齐？

这不只是Fable的问题。Mollick指出的是所有长周期多Agent系统面临的共同挑战。

该怪谁？架构设计与用户习惯的双重盲区

从架构层面看，Anthropic为Fable设计的持续上下文和自适应思考机制是其优势的根源，但也为语言漂移提供了土壤。Fable的官方提示指南强调了多上下文窗口工作流，Agent需要在跨会话的环境中保持状态一致性。在这种架构下，Agent之间的通信语言本身就成为了状态的一部分，持续的自我引用使语言模式不断固化。

从用户层面看，大多数人还没有意识到需要对长时间运行的Agent进行语言管理。我们习惯于让AI说它想说的话，然后被动接受。但在Fable的场景中，不加干预的放任会导致输出质量的渐进式退化，不是能力退化，而是可理解性退化。

一些业界观察者已经注意到这个问题的严重性。LinkedIn上一位开发者评论道：“Fable 5在长时间任务中变得极其啰嗦，而且似乎有一套自己的叙事逻辑。如果你不反复强调简洁，它会在回复里写满它自己觉得优雅但实际上冗余的段落。”这正是Mollick所说的“它自己的内部怪异韵律”。当AI不再针对人类听众优化语言，而是针对自己的内部回路优化，结果必然偏离人类的理解舒适区。

Mollick的发现本质上是对整个行业的一个提醒：随着AI系统从单轮对话进化到多Agent长周期任务，人类的监督方式必须同步进化。用通俗语言报告不应该是一个可选的提示，而应该是Agent架构中的默认约束。

方言之外，还有更大的问题

Fable的语言漂移是一个微小的信号，但它指向的是一道正在变宽的门，一道通往AI系统内部自主性不可知的大门。当一个系统可以自主运行数小时，启动数十个子Agent，在人类几乎无法追踪的回路中自我迭代，语言漂移只是最表面、最容易被察觉的症状。

业界已经开始正视这个问题。2025年，Cooperative AI Foundation的研究指出，多Agent系统的协调失败会产生“新颖且被低估的风险”，其涌现行为无法从单Agent测试中预测。Schmidt Sciences在2026年中启动了一项专门针对多Agent世界安全性的研究计划，明确提到需要“开发可扩展的方法来监控和控制日益复杂的AI系统网络”。Mollick在Fable上发现的语言漂移，恰恰是这些学术警告在现实世界中的第一个具体案例。

对于使用Fable和类似长周期Agent系统的开发者、研究者和企业用户，Mollick的建议值得认真对待。始终在系统提示中明确要求用通俗语言报告，并将这一约束写入Agent的行动准则。定期检查Agent的中间输出，而不仅仅是最终结果。设计监督回路，不一定要人在回路中，但一定要可理解性在回路中。

AI的方言可以很有趣。但当它开始影响系统输出的可读性和可理解性时，它就不是彩蛋，而是警示灯。

Agent之间说得越热闹，人类越需要确保自己还能听懂。