国产模型集体转向:从拼参数到拼工程交付,算力景气度进入超级周期

2026.06.21 20:57
2026年6月,智谱GLM-5.2与Kimi K2.7 Code相继发布,不约而同聚焦编程、长上下文Agent和工程交付能力,标志着国产大模型从通用问答转向企业级工作流。同期DeepSeek完成510亿元首轮融资、微信AI智能体进入灰度测试、Anthropic预计Q2营收达109亿美元。模型层需求爆发叠加DRAM/NAND价格创历史新高、GPU租赁持续涨价,算力景气度正形成结构性超级周期。

2026年6月,中国大模型行业正在完成一次无声但剧烈的转向。

短短一周内,智谱AI发布了GLM-5.2(6月17日),月之暗面推出并开源Kimi K2.7 Code(6月12日)——两款国产旗舰模型不约而同地将火力集中在同一个方向:编程长上下文Agent工程交付

这不是巧合。这是国产大模型从"拼参数、刷榜单"的第一阶段,正式迈入"拼工程、做交付"第二阶段的标志性时刻。

与此同时,DeepSeek完成首轮约510亿元融资,投后估值近4000亿元(约合500亿美元),创下中国AI单轮融资历史纪录;微信AI智能体进入灰度测试,项目被腾讯列为最高战略优先级;Anthropic预计Q2营收达109亿美元并首次实现运营盈利;全球DRAM和NAND价格双双创下历史新高,AI云厂商GPU租赁价格持续上行。中信建投6月21日研报明确指出:算力、存储和租赁服务景气度有望延续。

这些事件指向同一个判断:模型层的竞争正在从通用问答全面转向开发者工具链与企业级工作流,而算力作为不可绕过的底层生产要素,正迎来一轮结构性的超级周期。

一、集体转向:国产模型的"工程化"觉醒

先看两个直接的产品信号。

6月12日,月之暗面发布并开源了Kimi K2.7 Code。相比上一代K2.6,新模型在Kimi Code Bench v2上提升21.8%,MLS Bench Lite提升31.5%,Agent自主执行能力提升约10%。但真正值得关注的不是评测数字——而是设计哲学的转变:模型Token平均消耗量降低了30%,却实现了更强的代码生成与Agent执行能力。这是一个典型的"做得更好+花得更少"的工程化配方。月之暗面同步预告了高速版,输出速度可达普通版的5至6倍,常规场景约180 Token/s,短上下文场景最高260 Token/s,以2倍价格提供6倍速度。

Kimi K2.7 Code的API定价延续前代——1M Token输入6.5元、输出27元——并未因性能提升而提价。这种"升配不升价"的策略,瞄准的显然是开发者生态的规模化获取。

五天后,智谱AI推出GLM-5.2。凭借1M长上下文窗口和华为昇腾0 Day推理优化,GLM-5.2在百万用户盲测的代码评估系统Code Arena中取得全球可用模型第一的成绩。在侧重真实工程场景的FrontierSWE基准上,GLM-5.2获得74.4分,距离Claude Opus 4.8的75.1分仅差不到1%。智谱同步更新了开发者工具ZCode 3.0,并宣布GLM-5.2以最宽松的MIT协议开源——允许免费商用,且模型训练与线上推理均未依赖海外算力。

两款模型的选择高度一致:编程能力、长上下文Agent、开源。这不是偶然。

为什么是编程?因为编程是大模型当前最能产生确定性商业价值的场景。企业不会为一个"能陪你聊天"的模型花大钱,但愿意为一个能自动补齐函数、排查Bug、生成单元测试、甚至完成整个软件交付流程的AI开发者工具持续付费。Claude Code在Anthropic体系中已是核心收入引擎,OpenAI Codex同样增长迅猛。国内市场正在复制这条路径——月之暗面面向开发者的Kimi Code Plan已拥有活跃付费企业用户,GLM-5.2上线首日即完成与华为昇腾、平头哥、摩尔线程等7家国产算力平台的全适配。

二、融资弹药与超级入口:两个加速器

DeepSeek的510亿"弹药"

6月16日,DeepSeek完成成立以来的首轮外部融资,规模约510亿元,投后估值近4000亿元。据企查查和多家媒体披露,创始人梁文锋个人出资约200亿元为本轮最大单一出资方,腾讯出资约100亿元,宁德时代体系出资约50亿元,网易、京东、IDG资本、Monolith砺思资本等跟投。国家人工智能产业投资基金出资10亿元,是唯一直接持股并享有投票权的投资方。

这笔融资的特殊之处在于交易架构:所有外部投资者均需将资金投入梁文锋管理的有限合伙企业而非直接持股DeepSeek,且面临五年锁定期。外部投资方不享有投票权,仅能获取特定财务信息和后续融资优先认购权。梁文锋以个人200亿元的出资额和投票权设计,将其对公司的绝对控制权牢牢握在手中。

这种"控制权优先"的安排,与OpenAI、Anthropic等国际AI公司的股权设计逻辑如出一辙——技术型创始人保护公司战略独立性的共识正在全球复制。对DeepSeek而言,这笔弹药可以大规模采购GPU、扩建AI基础设施、吸引顶尖人才并加速商业化——典型的"强者愈强"正反馈。这家以极致性价比(API价格为GPT-5.5 Pro的约1/700)著称的公司,正在从"反资本叙事"走向"资本驱动扩张"。

微信AI:14亿用户的推理引擎

据英国《金融时报》6月2日报道,腾讯正在测试微信内嵌AI智能体原型。用户在微信主界面向右滑动即可调出AI对话窗口,指令可直接调用微信小程序矩阵完成外卖、预订、挂号等数百种操作。该项目已被腾讯列为"最高战略优先级"。

微信拥有14亿月活用户,是中国最大的超级应用。如果微信AI全量上线,AI的入口将从独立App(豆包、Kimi、通义千问)向超级应用生态发生根本性迁移。每多一次调用,就意味着一次推理Token消耗。14亿用户的潜在调用频次,将产生天文数字级别的推理算力需求。

知情人士透露,微信AI大规模上线面临的主要瓶颈恰恰是算力供给——"在美国出台芯片出口禁令前,腾讯布局保守,没有足量囤货英伟达芯片,而目前国内自研芯片的产能供应依旧紧张。"当中国最大的科技公司为芯片发愁时,整个行业的算力缺口可见一斑。

三、海外镜像:Anthropic验证"企业交付"的商业价值

如果说国内市场还在验证"模型转开发者工具"的可行性,那么Anthropic已经给出了终局答案。

据The Information报道,Anthropic在向投资人披露的融资材料中预计:2026年第二季度营收将达109亿美元(第一季度为48亿美元),环比增长127%,并首次实现单季度运营利润约5.59亿美元——较此前内部预测的2028年扭亏提前了整整两年。公司年化经常性收入(ARR)已从2024年底的约10亿美元飙升至2026年4月至5月的300至450亿美元水平。

收入结构更说明问题:Anthropic约85%的营收来自企业与开发者客户,已有超过500家企业客户年支出超过100万美元。Claude Code和Agentic工作流是企业付费的核心驱动力。

Anthropic的业绩曲线提供了一个清晰的"对标框架":如果你的模型产品足够优秀,企业愿意为单年代价百万美元的AI开发工具买单。这份答卷直接支撑了国产头部模型公司(月之暗面、智谱AI、DeepSeek)在B端叙事上的估值逻辑。

四、算力的三重共振

当模型层趋向务实、调用场景丰富化、企业付费意愿增强时,算力需求曲线正变得极其陡峭。中信建投研报明确指出:AI云厂商backlog增长,GPU租赁价格上行,CPU、DRAM/NAND供给约束扩散。

这背后是三重引擎的同时点火:

引擎一:GPU算力——云厂商的"抢卡"竞赛

2026年春季起,全球云厂商密集上调AI服务价格。阿里云于3月和4月两次调价,部分算力卡涨幅最高达34%,百炼平台ModelUnit服务再涨2%至7%。海外方面,AI基础设施投资人Gavin Baker的数据显示,GPU连接、内存和推理芯片在2025年涨了20%,2026年至今又涨了17%,年化涨幅超过25%。

Meta将2026年全年资本开支指引上调至1250至1450亿美元,组件价格上涨和未来算力容量提前押注是主因。全球AI云厂商的backlog持续创新高,GPU租赁等待周期越来越长。这是典型的"算力卖方市场"——需求端无法在短期内自建供给,只能接受不断抬高的价格。

引擎二:存储——结构性紧缺创历史新高

AI推理中的长上下文任务(1M Token乃至更长)对内存带宽和容量的需求,已经使存储成为AI系统的核心瓶颈。

美光科技5月发出最新警告:HBM、DRAM和NAND的供应紧张局面将远超2026年。摩根大通随后确认了这一判断,认为存储供需缺口短期内不可逆转。供给端受制于多重结构性约束:HBM晶粒尺寸持续增大导致单片晶圆切割芯片数量下降,EUV光刻导入先进DRAM製程虽提升精度却对产能爬坡形成新约束。

价格方面,DRAMeXchange数据显示PC用DDR4 8Gb均价已涨至20美元,创历史新高。TrendForce全面上修涨幅预测:DRAM合约价从季增55%至60%上调至90%至95%,NAND Flash从季增33%至38%上调至55%至60%。存储三巨头——三星电子、SK海力士、美光——今年股价涨幅均在200%以上,SK海力士市值今年首次突破1万亿美元,与英伟达、台积电并肩成为AI时代核心供应商。

引擎三:租赁服务——从"买卡"到"租力"的模式切换

当硬件价格持续攀升、供应周期不断拉长时,越来越多的中小企业和开发者选择GPU租赁而非自购。AI云厂商的backlog增长反映的正是这种需求溢出——头部客户(Meta、微软、谷歌)自建数据中心的同时,长尾客户的算力需求涌向云端租赁市场,推高了GPU租赁价格。

这形成了算力景气度的清晰传导链条:GPU芯片涨价→云服务器涨价→GPU租赁涨价。每一个环节的参与者都在享受"卖方红利"。

五、谁在赢?谁危险?

站在2026年年中的时间节点,国产大模型行业的竞争格局正在发生深刻重构。

赢家已经清晰:

第一类是模型能力与商业化双轮驱动的头部创业公司——月之暗面、智谱AI、DeepSeek。它们完成了从"技术极客"到"企业服务商"的身份切换,凭借融资弹药和产品迭代速度守住了赛道领先位置。

第二类是掌握超级应用入口的平台型公司——腾讯(微信AI)、阿里巴巴(通义千问)、字节跳动(豆包)。它们不需要自研最强的基座模型,但手握用户分发权。AI入口向超级应用的迁移将使它们在推理算力消耗上占据统治性地位。

第三类是算力基础设施供应商——AI云厂商、GPU租赁平台、存储芯片公司。它们不直接参与模型竞争,但每一轮模型调用量的增长都在为它们的营收曲线加码。

谁面临风险?中等规模的模型厂商,尤其是那些既无融资弹药、又无超级应用入口、也无垂直行业深度的公司,将面临最残酷的挤压。大模型行业正在从"百花齐放"走向"头部集中"——这是所有技术平台型市场都经历过的自然演替。

算力景气度能否持续,答案取决于一个关键变量:模型调用量是否会继续爆发。从GLM-5.2与Kimi K2.7 Code的工程化转向,到微信AI的超级入口潜力,到Anthropic的企业级收入验证——三个信号都指向同一个方向:大模型的推理Token消耗量才刚刚进入加速爬坡期。

算力卖方市场,远未到收场的时候。

作品声明:内容由AI生成