AI算力不能总为爱发电-钛媒体官方网站

文｜商业秀，作者 | 罗小媚编 | 杨肖若张弘一

“月均调用API超15万次每月”，盯着团队开发的AI客服SaaS工具后台近三个月的API调用量和账单，李然的眉头紧锁。

4月13日，阿里云官网的一纸公告，更让李然的心一沉。公告显示，调整DataWorks标准版、专业版用户的API（‌应用程序编程接口）免费额度并支持按量付费。DataWorks标准版，调用API的免费额度调整为10万次/月，超出部分采用OpenAPI按量付费的方式。

这意味着，从4月14日政策生效起，每月至少5万次的超额调用，将让李然这位DataWorks标准版的用户，运营成本增加超8000元，而他背后的AI客服SaaS工具上月的净利润刚过万。

“算了一笔账，这真的不是靠AI降本提效了。你看我们去年这时候，甚至还在为免费调用量用不完发愁呢！”李然笑着对我们调侃道。

2025年同期，李然和他的创业项目调用1000万Token的成本仅500元，而如今同样的用量，如果说再叠加腾讯云混元模型、百度文心的单价上调，成本已飙升至近万元。

他说，自己的公司现金流还能再撑三个月，但成本一旦上涨，始终是有些压力。

今年以来随着AI的火爆，尤其是2026年春节以来的OpenClaw（龙虾）热彻底改变了Token的消耗逻辑，像李然这样的中小开发者急需Token算力。

根据摩根大通曾预测，中国的AI推理Token消耗量预计将从2025年的约10千万亿增长至2030年的约3900千万亿，五年间增长约370倍。

当全球AI行业还在期待技术突破时，一场由算力价格调整引发的成本考验也在降临。最近国内外AI和云服务厂商的价格调整动作开始愈发密集，根据公开报道，阿里云已确认，从4月18日起，AI算力、存储等产品将全线涨价，最高涨幅34％。

从阿里、腾讯到AWS、OpenAI，无一家缺席，甚至海外厂商的调整幅度比国内更甚。这意味着，所有消费者此前享受的API免费调用服务大幅缩水，超出部分必须真金白银买单，尤其是对像李然这样高频用户来说，也会增加他们的调用API成本。

这让无数中小开发者正在重新审视这场由AI带来的成本优化竞赛。

01 一场全球范围的算力调价

这场调整，其实是全球范围内的算力价值重估。

先看国内厂商的调整路径。最先调整的是百度智能云，3月18日其官宣，4月18日起AI算力相关产品价格上调5%-30%，文心一言系列API单价上调12%-25%，取消低阶模型的“永久免费不限量”，改为QPS限流+超额计费。

这被业内认为是算力补贴时代的结束，毕竟过去靠免费额度吸引的中小开发者，如今需按实际用量付费。

紧随其后的是腾讯云，3月调整混元模型API价格，4月9日腾讯云正式发布价格调整公告，宣布将于5月9日起对AI算力、容器服务TKE-原生节点及弹性MapReduce（EMR）相关产品刊例价统一上调5%。

字节火山引擎的调整相对隐蔽一些，Q1豆包LLM Token单价调整，文生视频API价格较内测期上涨，单15秒视频成本约15元，同时取消无限免费调用，仅保留新用户500万Token/30天的短期额度。

智谱AI的调整最为频繁。几乎智谱的每次发布模型都伴随着价格上涨。4月8日，智谱发布旗舰开源模型GLM-5.1，同时智谱GLM系列API价格再度上调10%，直逼Anthropic。本月12日，智谱Coding Plan（海外版）涨价，月付价格几乎翻倍，这已经是智谱今年第三次提价了。

在3月31日的业绩电话会上，智谱CEO张鹏表示，2026年第一季度智谱的API调用定价提升83%，即便如此，市场依然呈现出供不应求的情况，调用量增长400%。

算力虽贵，但也在印证一个事实，那就是AI已从可选工具变成了企业的刚需生产资料，用户对价格的敏感度却低于对模型能力的需求。

海外厂商的调整也来势汹汹。1月22日，亚马逊AWS打破20年“价格下行”惯例，上调EC2机器学习容量块价格15%；2月15日，微软Azure调整GPT-4o、GPT-4 Turbo API价格，取消GPT-4o免费额度；3月10日，Google Cloud官宣5月1日起AI计算实例价格调整，下架Gemini低价订阅套餐；OpenAI则调整GPT-4o/4 Turbo API价格，ChatGPT Plus从20美元/月涨至30美元/月，每日消息限30条。

从国内到海外，从算力实例到API调用，这场全球范围内的集体调价，硬是把AI产业从补贴扩张阶段拉回到了价值定价的理性轨道。免费额度成为过去，按量付费才是常态，开发者们是时候需重新算一笔账，评估成本结构了。

02 调整背后的逻辑

全球厂商们集体调整价格，逐利是表面的，本质上还是AI产业从扩张期进入盈利验证期的必然。「商业秀」认为，这场全球范围的调整背后藏着3个底层逻辑。

首先，最核心的底层逻辑是算力价值重估。

随着AI的核心燃料（GPU、HBM）的供给紧张，成本上涨，也就倒逼所有下游厂商调整价格。而这一切的起点，或许要回到英伟达来看。

目前英伟达占据全球85%的AI芯片市场份额，净利润率高达56%，可以说，在很大程度上，它的定价直接决定了整个行业的成本底线。

2026年，英伟达Blackwell系列GPU交付周期排至2027年，单卡采购成本同比上涨30%以上。而HBM3E高带宽内存现货价较2025年底上涨超20%，全球产能缺口50%-60%，甚至出现供应紧张的局面。

更重要的是，英伟达通过硬件+软件的闭环生态，进一步拉高了行业的成本。全球90%的AI训练代码基于CUDA编写，500万开发者都依赖这家巨头的生态，每颗H20芯片就要搭配1.2万美元的CUDA授权费，隐性成本占比就超过了30%。

这种从性能到成本的双重影响，也让阿里、腾讯、微软、谷歌等厂商们只能被动接受成本上涨，继而再将压力传导给下游用户。

如果说，算力成本上涨是被动调整的理由，那么Token需求的指数级增长，就是厂商们主动调整的底气。

2026年，AI应用从单轮对话进入到了智能体时代，随之而来的是Token消耗呈现指数级的增长。以OpenClaw等Agent为例，它的单任务多轮递归、工具调用和反思验证，光是Token消耗，就已经是传统对话的50到100倍，单个活跃Agent月耗Token可以达到普通用户的千倍以上。

数据显示，2026年一季度国内日均Token调用量突破140万亿，较2024年初的1000亿增长超过1400倍。字节豆包日均Token消耗超过120万亿，其中多模态（比如视频/图像）Token占比超过40%，成本是纯文本的10倍以上。而百度千帆平台企业用户Token消耗Q1环比增长了280%。

目前算力的消耗状态可以用一句话来形容，那就是低阶免费模型需求旺盛，高阶付费模型供不应求。一旦需求增长，供给紧张，价格自然就由供需决定，这也就可以解释为什么智谱价格调整后调用量反而增长400%了。

由是观之，高质量Token成为稀缺资源。

当然最根本的变化，还是整个AI产业的商业逻辑变了。行业开始从烧钱换规模、亏损换用户，转向了盈利优先和精细化运营，定价权从用户端回归厂商端。

过去两年，整个AI行业处于疯狂扩张的阶段，大家的资本投入也多，厂商们靠着免费API、低价算力吸引用户从而占领市场。哪怕是AI业务持续亏损也无所谓，反正还有其他业务的利润支持，还有资本的资金来保障持续投入。

但是，进入2026年，风向就变了。资本投入趋于理性了，厂商们纷纷表示我们有盈利压力了，毕竟大老板说了：AI业务必须给我盈利。

所以，这样一来，我们就能理解为什么阿里云调整免费额度，开启按量付费，而腾讯云、百度智能云全链路调整价格。字节火山引擎则是利用内部规模效应降低成本，同时通过外部价格调整实现AI业务盈利，海外的OpenAI、Anthropic，则也通过价格调整兑现模型能力的价值。

参考亚马逊AWS历经14年的奋斗才跨过盈亏平衡点，阿里云则在2022年走向盈利。国内云厂商的价格战，早在 2014 年便已拉开帷幕，此后十余年间从未停歇，阿里云常年主动发起大规模降价，单次最高降幅超 50%，而腾讯云则始终快速跟进，甚至祭出比阿里云更低的报价，展开贴身肉搏式竞争。

据公开报道，腾讯云在过去很长一段时间里被视为集团的成本中心。为了在阿里云和华为云的激烈竞争中快速抢占市场份额，腾讯云长期采取了激进的低价策略，通过远低于成本的报价和长期不涨价的承诺来获取大客户订单。‌

而这种策略，虽然让腾讯云的营收规模快速做大，一度坐稳国内第二，但也会导致业务长期处于规模不经济的怪圈，也就是规模越大，亏损可能越严重。直到2025年，腾讯云业务才实现了全年规模化盈利。

毋庸置疑的是，随着AI算力需求的上涨，市场规模越来越大。但是，绝大多数云厂商却依旧是常年处于亏损状态。目前这几家除了市值突破4000亿港元的智谱，有资本底气来继续抬高价格，继续折腾，其他家几乎还在垂死挣扎。

在这样的大环境下，更不要说中小企业的生存了。

03 成本增加和账单反思

“我们这种小团队，没有自研模型，没有算力储备，只能依赖公有云API。”李然的声音里透着一丝无奈，“成本上涨后，要么调整价格，要么压缩利润。”

更现实的是，厂商们会把算力资源，优先分配给付费率高、用量大、毛利高的客户比如金融、政企、头部互联网企业等，中小企业不仅会增加成本，还可能面临资源分配的问题，获取稳定算力的难度也会有所增加。

这背后最受影响的反而是那些套壳应用，也就是没有任何技术壁垒，只是简单调用API做二次开发的企业和平台。“一旦成本上涨，它们的成本优势减弱，那就需要重新审视商业模式了。”前述投资人告诉「商业秀」。

对个人开发者来说，免费额度的调整同样也会带来影响，因为零成本试错的窗口关闭了。百度调整低阶模型的免费额度、字节调整豆包的免费额度，仅保留新用户短期额度（百度100万/90天、字节500万/30天）。

是时候需重新规划成本投入了。这种账单反思，也正在倒逼开发者从无脑调用转向精打细算，开始研究模型压缩、量化、上下文窗口优化、RAG检索增强，甚至说混合调用不同版本模型，这些只是为了降低Token消耗。

不过，这也需要时间和技术积累，对于很多中小团队来说，当务之急是重新规划公司的发展路径。李然决定看看研究一下各家的套餐，“组合叠加使用起来，会更划算。”

可以看到的是，这场价格调整，正在加速AI产业的分化。头部企业凭借全栈能力与规模效应，调整后仍能保持毛利，甚至通过资源优化进一步巩固市场份额。而中小厂商，尤其是无自研模型、无算力储备的中小AI服务商，成本增加无法传导，利润受到影响，需重新寻找发展路径。

不过，也会有例外，那些深耕垂直场景、有核心技术（如模型优化、成本管控）的中小厂商，反而可能在这场调整中跑出来。它们不需要依赖高端API，只要能在垂直场景中实现降本增效，就能找到自己的出路。

相信有很多人关注这场价格调整，有人认为厂商们逐利，让中小企业和开发者面临成本压力。但「商业秀」认为，这场调整也预示着AI产业正在走向成熟。毕竟，过去两年免费AI的补贴模式，让很多人误以为AI是免费的，也催生了大量无价值的应用，浪费了算力资源。而2026年的这场集体调整，本质上是市场在优化和淘汰无价值的应用，倒逼技术迭代。只有这样，才能让真正有价值的AI应用获得合理的商业回报。

算力可以走普惠路线，可以追求性价比。但没有厂商，能一直为爱发电。

这场调整对厂商们来说，也是商业逻辑的回归。接下来可以用成本+合理利润定价来实现AI业务的可持续盈利。对中小企业和开发者来说，它们除了要控制自己的成本，更要转向技术优化和深耕垂直场景。

AI从来都不是免费午餐。未来AI行业进入价值付费时代，只有真正能创造价值，做好成本管控的企业和开发者，才能不被时代抛弃，站稳脚跟活下去。