2026年6月16日下午5点50分,模型聚合平台OpenRouter在官方账号发了一条推文:GLM-5.2正式上线。平淡无奇的措辞、一张截图、一个链接——但它背后藏着一条更长的故事线:三天前,这个星球上最强的几个闭源大模型刚刚被美国政府一纸禁令掐了电;两天前,智谱AI用同一个时刻——17:21——宣布GLM-5.2全量开放;现在,它登上了全球最大的AI模型集市。
这不是一次普通的模型更新。这是一张被时运推到聚光灯下的开放牌,而它恰好在最需要的时候,打在了最疼的地方。
现象层:四个月四次迭代,GLM-5系列跑出了中国大模型的最快迭代速度
先把时间线摊开。
今年2月11日,智谱AI(已更名为Z.ai)发布了GLM-5——一个744B总参数、40B激活参数的MoE混合专家模型。GLM-5在LMArena上同时拿下Text Arena和Code Arena的开源模型双料第一,SWE-bench Verified得分77.8%,在内部评测体系CC-Bench-V2中把前代GLM-4.7甩开一大截。更重要的是,它全程在10万块华为昇腾910B芯片上完成训练——没碰过一块NVIDIA GPU。发布当天,智谱港股单日暴涨26%,一周内累计上涨约70%——市场对全华班芯片训出前沿模型的故事给出了直接定价。
3月中旬,GLM-5 Turbo上线,主打高速推理,262K上下文,在OpenClaw等智能体场景中做实时响应。
4月7日,GLM-5.1发布。它在SWE-bench Pro上拿到58.4分,超过了同期的GPT-5.2,拿下开源模型编码SOTA。更大的变化在智能体能力上——GLM-5.1可以自主运行8小时、完成600+次迭代优化循环,这意味着它不是一个写代码的工具,而是一个能持续做工程的智能体。5月,高速版进一步将生成速度拉到400 tokens/s。
6月13日17:21,GLM-5.2全量向Coding Plan用户开放。核心变化:上下文窗口从200K直接跳到100万token,输出上限131,072 token,引入High和Max两种思考深度档位,原生兼容Claude Code和OpenClaw。一周内开源权重上架HuggingFace,MIT协议,商用无限制。
6月16日,登陆OpenRouter。
四个月四次旗舰级发布,覆盖了从能写代码到能跑工程到能吞下整个代码仓库的全链路。迭代密度在全球开源模型阵营中几乎没有对手。
分析层一:100万token上下文,不只是数字游戏
1M上下文到底是什么概念?
GLM-5.2的上下文窗口约等于75万英文单词——足以在一次会话中塞进一个中等规模的完整代码仓库,包括全部源码、测试文件、配置文件和历史commit记录,然后让模型在不遗忘任何上下文的情况下,完成跨文件的排错、重构和功能迭代。
这不是理论数字。GLM-5.2的关键词是可用(usable)。过去很多模型标称长上下文,但在超过一定长度后会出现严重的中间信息丢失(lost-in-the-middle)问题。GLM-5.2延用了GLM-5系列的DSA稀疏注意力机制——动态分配算力聚焦关键文本区块——从架构层面减少长序列推理的注意力衰减。虽然Z.ai在发布时没有提供GLM-5.2的独立基准测试成绩,但从技术路线看,这套机制已经在GLM-5和GLM-5.1上经过了验证。
把1M上下文放在2026年中的竞争版图里看更有意思。Claude Opus 4.6标配1M,Gemini 3.1 Pro标配1M(部分版本甚至达到10M),GPT-5.5标配1M。Qwen3.6-Max-Preview和MiniMax M3也都在1M上下。1M上下文已经成为2026年旗舰模型的入场券。真正拉开差距的不是有没有,而是多少钱和能不能私有化部署。
在这两个维度上,GLM-5.2的定价是降维打击。Claude Opus 4.6的API价格为每百万token输入5美元、输出25美元;GPT-5.5为输入5美元、输出30美元。而GLM Coding Plan的入门档——Lite套餐——月费仅49元人民币(约7美元),就包含完整版的GLM-5.2,含每5小时80次prompt、每周400次调用额度。即便是API按量计费,GLM-5系列的token定价也维持在同级闭源模型的五分之一到八分之一。
一个1M上下文窗口的Claude级编程模型,价格是竞品的零头,还附带MIT开源许可——可以本地部署、私有化运行、二次开发商用,没有任何人能在远程把它关掉。
这句话在2026年6月13日之后的语境里,已经不是一句空洞的口号。
分析层二:17:21的时间暗号,和一张更大的开放牌
时间倒回72小时。
美国东部时间6月12日下午5点21分,Anthropic收到美国政府商务部的紧急信函,援引国家安全条款,要求立即暂停所有外国公民——包括在美国境内外的Anthropic外籍员工——对Claude Fable 5和Claude Mythos 5的访问权限。这两个模型刚上线72小时,曾在多项基准测试中登顶。一纸禁令,全部下线。
受影响的不只是Anthropic自己的用户。据估算,Fable 5和Mythos 5支撑着约1.2万个应用的生产运行。这些开发者一夜之间必须找替代方案。
北京时间6月13日下午5点21分——分秒不差地对应了Anthropic收到禁令的时刻——智谱AI发布公告:GLM-5.2全量开放,覆盖Lite、Pro、Max、Team所有订阅档位,不做任何功能阉割。公告中写了一句在开发者社区被大量转发的话:
前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。
这不是巧合。智谱把发布时间精确到17:21,是对Anthropic禁令的直接回应。这也不是一个单纯的PR动作——GLM-5.2的产品节奏确实跑在了前面:3月GLM-5.1、5月高速版、6月13日5.2,每一步都是计划内的迭代。只不过外部环境突变,让这次发布从常规升级变成了战略时刻。
市场迅速给了反馈。6月15日港股开盘,智谱高开近15%,盘中一度涨超40%,收盘仍涨约37%。东方证券研报的判断直截了当:
Anthropic领先模型的下架,将有利于中国国产领先模型公司形成替代效应。
但替代效应的前提是产品真能接住需求。第三方评测机构KingBench 3给出了GLM-5.2的初步成绩:81.43分,仅次于Claude Opus 4.8和Fable 5。有开发者实测后给出评价GLM-5.2 Max > GPT-5.4——这个说法或许夸张,但至少说明它在真实编码场景中的体感不虚。
分析层三:OpenRouter登陆的战略意义——中国大模型的开发者外交
GLM-5.2登陆OpenRouter这件事本身,值得单独拆开看。
OpenRouter在2026年已经成为全球AI模型的中央车站。超过500万开发者通过一个统一的API接入逾百种模型,覆盖OpenAI、Anthropic、Google、Meta、Mistral以及大量开源模型。它不只是分发渠道——它是全球开发者发现、比较和切换模型的决策界面。
OpenRouter is building the financial infrastructure layer for the AI economy on Stripe.
这是Stripe在2026年Sessions大会上与OpenRouter官宣深度合作时的定位表述。一个中国大模型出现在OpenRouter上,意味着它进入了全球开发者的默认选项集。当开发者打开OpenRouter的模型列表,看到GLM-5.2和Claude Opus、GPT-5.5、Gemini 3.1并排陈列,它就获得了与这些巨头同场竞争的入场券。
而这恰恰是GLM系列的独特优势所在。在这一批登陆OpenRouter的中国模型中,GLM-5.2有一个竞品难以复制的组合:前沿编码能力 + 1M上下文 + MIT完全开源 + 极低定价。MiniMax M3有1.05M上下文,但走的是闭源API路线。GLM-5.2是当前OpenRouter上极少数同时满足1M上下文 + MIT开源 + 商用无限制 + 云端订阅极低价四个条件的前沿编码模型。
这对应了一个正在形成的开发者共识:在生产环境中,模型的可控性正在变得和模型能力同等重要。当一个闭源模型可能在72小时内被政府一纸公文下架时,部署在自己服务器上的MIT开源模型就不再只是一个理想主义选项,而是一个风险管理决策。
GLM-5.2的Claude Code原生兼容进一步降低了迁移成本。开发者只需要改一行环境变量——ANTHROPIC_DEFAULT_SONNET_MODEL=glm-5.2[1m]——就可以把Claude Code的默认编码后端从Claude切换到GLM-5.2。Cline、Kilo Code、OpenClaw等主流编码智能体工具同样可以一键接入。迁移摩擦接近于零。
结论与展望:中国大模型出海,三条路径中只有一条是宽的
如果我们把GLM-5.2登陆OpenRouter放回更大的产业版图里看,它代表了中国大模型出海的一条特定路径。
大致来说,中国AI公司走向全球有三条路。第一条是能力碾压路线——做出全球最强的模型,靠绝对性能赢得市场。这条路在2026年的今天仍然困难重重,因为前沿性能的差距虽然缩小了,但品牌认知、生态黏性和开发者信任的积累需要更长时间。第二条是地缘替代路线——在国际市场因出口管制出现供应缺口时,以国产模型填补空白。这条路的机会窗口确实存在(Anthropic的下架就是最典型的例子),但它高度依赖外部事件,不可持续规划。
第三条路,也是GLM-5.2正在走的路,是开放基础设施路线:以MIT开源协议构建最大公约数的开发者生态,以极低定价消除成本敏感度门槛,以OpenRouter等全球分发渠道降低接入成本,最终让模型成为全球开发者工具箱里默认就有的一个选项——不是替代品,而是基础设施。
这条路有一个容易忽略但至关重要的优势:开源模型的护城河不是技术壁垒,而是生态惯性。当全球数万开发者把GLM-5.2作为Claude Code的默认后端、写进了自己的CI/CD管线和内部工具链,换模型的成本就不再只是API key切换,而是整个工程体系的重新调整。而MIT协议意味着这个生态不会被某个公司的商业决策或某个政府的行政命令打断——因为开源权重就躺在开发者自己的硬盘上。
当然,GLM-5.2还有硬伤。Z.ai在发布时没有提供任何官方的独立基准测试成绩——没有SWE-bench,没有Terminal-Bench,没有Code Arena。社区给出的KingBench 3得分是积极的信号,但在大规模生产环境中1M上下文是否真的可用、是否会出现大多数长上下文模型都有的性能衰减,仍需等待社区在实际代码仓库中跑出来的数据。没有独立评测之前,所有关于GLM-5.2性能的判断都应该带着待验证的标签。
但更大的问题是:GLM-5.2的快速迭代能否持续?四个月四次发布是惊人的速度,但当产品线从单一模型扩展到Coding Plan订阅服务、API接口、开源社区维护和全球分发渠道时,团队的精力会被大幅稀释。华为昇腾芯片的训练效率虽然已经在GLM-5上得到了验证,但在应对1M上下文带来的推理算力压力时,昇腾生态的工程优化是否跟得上,同样值得持续关注。
GLM-5.2的下一步——开源权重上架HuggingFace——才是真正的压力测试。届时全球开发者会用自己的代码仓库、自己的工作流、自己的评测体系来检验这套1M上下文 + 744B MoE + DSA稀疏注意力的组合是否真的能打。通过,它就是一个全球化的开源基础设施;没通过,它就是又一个把参数堆上去了但实际体验打折的长上下文模型。
中国大模型要走向全球,能力是入场券,定价是加速器,开源是信任锚——但最终决定能走多远的,是生态。






快报