文|商业秀,作者 | 罗小媚 编 | 杨肖若 张弘一
“月均调用API超15万次每月”,盯着团队开发的AI客服SaaS工具后台近三个月的API调用量和账单,李然的眉头紧锁。
4月13日,阿里云官网的一纸公告,更让李然的心一沉。公告显示,调整DataWorks标准版、专业版用户的API(应用程序编程接口)免费额度并支持按量付费。DataWorks标准版,调用API的免费额度调整为10万次/月,超出部分采用OpenAPI按量付费的方式。
这意味着,从4月14日政策生效起,每月至少5万次的超额调用,将让李然这位DataWorks标准版的用户,运营成本增加超8000元,而他背后的AI客服SaaS工具上月的净利润刚过万。
“算了一笔账,这真的不是靠AI降本提效了。你看我们去年这时候,甚至还在为免费调用量用不完发愁呢!”李然笑着对我们调侃道。
2025年同期,李然和他的创业项目调用1000万Token的成本仅500元,而如今同样的用量,如果说再叠加腾讯云混元模型、百度文心的单价上调,成本已飙升至近万元。
他说,自己的公司现金流还能再撑三个月,但成本一旦上涨,始终是有些压力。
今年以来随着AI的火爆,尤其是2026年春节以来的OpenClaw(龙虾)热彻底改变了Token的消耗逻辑,像李然这样的中小开发者急需Token算力。
根据摩根大通曾预测,中国的AI推理Token消耗量预计将从2025年的约10千万亿增长至2030年的约3900千万亿,五年间增长约370倍。
当全球AI行业还在期待技术突破时,一场由算力价格调整引发的成本考验也在降临。最近国内外AI和云服务厂商的价格调整动作开始愈发密集,根据公开报道,阿里云已确认,从4月18日起,AI算力、存储等产品将全线涨价,最高涨幅34%。
从阿里、腾讯到AWS、OpenAI,无一家缺席,甚至海外厂商的调整幅度比国内更甚。这意味着,所有消费者此前享受的API免费调用服务大幅缩水,超出部分必须真金白银买单,尤其是对像李然这样高频用户来说,也会增加他们的调用API成本。
这让无数中小开发者正在重新审视这场由AI带来的成本优化竞赛。
01 一场全球范围的算力调价
这场调整,其实是全球范围内的算力价值重估。
先看国内厂商的调整路径。最先调整的是百度智能云,3月18日其官宣,4月18日起AI算力相关产品价格上调5%-30%,文心一言系列API单价上调12%-25%,取消低阶模型的“永久免费不限量”,改为QPS限流+超额计费。
这被业内认为是算力补贴时代的结束,毕竟过去靠免费额度吸引的中小开发者,如今需按实际用量付费。
紧随其后的是腾讯云,3月调整混元模型API价格,4月9日腾讯云正式发布价格调整公告,宣布将于5月9日起对AI算力、容器服务TKE-原生节点及弹性MapReduce(EMR)相关产品刊例价统一上调5%。
字节火山引擎的调整相对隐蔽一些,Q1豆包LLM Token单价调整,文生视频API价格较内测期上涨,单15秒视频成本约15元,同时取消无限免费调用,仅保留新用户500万Token/30天的短期额度。
智谱AI的调整最为频繁。几乎智谱的每次发布模型都伴随着价格上涨。4月8日,智谱发布旗舰开源模型GLM-5.1,同时智谱GLM系列API价格再度上调10%,直逼Anthropic。本月12日,智谱Coding Plan(海外版)涨价,月付价格几乎翻倍,这已经是智谱今年第三次提价了。
在3月31日的业绩电话会上,智谱CEO张鹏表示,2026年第一季度智谱的API调用定价提升83%,即便如此,市场依然呈现出供不应求的情况,调用量增长400%。
算力虽贵,但也在印证一个事实,那就是AI已从可选工具变成了企业的刚需生产资料,用户对价格的敏感度却低于对模型能力的需求。
海外厂商的调整也来势汹汹。1月22日,亚马逊AWS打破20年“价格下行”惯例,上调EC2机器学习容量块价格15%;2月15日,微软Azure调整GPT-4o、GPT-4 Turbo API价格,取消GPT-4o免费额度;3月10日,Google Cloud官宣5月1日起AI计算实例价格调整,下架Gemini低价订阅套餐;OpenAI则调整GPT-4o/4 Turbo API价格,ChatGPT Plus从20美元/月涨至30美元/月,每日消息限30条。
从国内到海外,从算力实例到API调用,这场全球范围内的集体调价,硬是把AI产业从补贴扩张阶段拉回到了价值定价的理性轨道。免费额度成为过去,按量付费才是常态,开发者们是时候需重新算一笔账,评估成本结构了。
02 调整背后的逻辑
全球厂商们集体调整价格,逐利是表面的,本质上还是AI产业从扩张期进入盈利验证期的必然。「商业秀」认为,这场全球范围的调整背后藏着3个底层逻辑。
首先,最核心的底层逻辑是算力价值重估。
随着AI的核心燃料(GPU、HBM)的供给紧张,成本上涨,也就倒逼所有下游厂商调整价格。而这一切的起点,或许要回到英伟达来看。
目前英伟达占据全球85%的AI芯片市场份额,净利润率高达56%,可以说,在很大程度上,它的定价直接决定了整个行业的成本底线。
2026年,英伟达Blackwell系列GPU交付周期排至2027年,单卡采购成本同比上涨30%以上。而HBM3E高带宽内存现货价较2025年底上涨超20%,全球产能缺口50%-60%,甚至出现供应紧张的局面。
更重要的是,英伟达通过硬件+软件的闭环生态,进一步拉高了行业的成本。全球90%的AI训练代码基于CUDA编写,500万开发者都依赖这家巨头的生态,每颗H20芯片就要搭配1.2万美元的CUDA授权费,隐性成本占比就超过了30%。
这种从性能到成本的双重影响,也让阿里、腾讯、微软、谷歌等厂商们只能被动接受成本上涨,继而再将压力传导给下游用户。
如果说,算力成本上涨是被动调整的理由,那么Token需求的指数级增长,就是厂商们主动调整的底气。
2026年,AI应用从单轮对话进入到了智能体时代,随之而来的是Token消耗呈现指数级的增长。以OpenClaw等Agent为例,它的单任务多轮递归、工具调用和反思验证,光是Token消耗,就已经是传统对话的50到100倍,单个活跃Agent月耗Token可以达到普通用户的千倍以上。
数据显示,2026年一季度国内日均Token调用量突破140万亿,较2024年初的1000亿增长超过1400倍。字节豆包日均Token消耗超过120万亿,其中多模态(比如视频/图像)Token占比超过40%,成本是纯文本的10倍以上。而百度千帆平台企业用户Token消耗Q1环比增长了280%。
目前算力的消耗状态可以用一句话来形容,那就是低阶免费模型需求旺盛,高阶付费模型供不应求。一旦需求增长,供给紧张,价格自然就由供需决定,这也就可以解释为什么智谱价格调整后调用量反而增长400%了。
由是观之,高质量Token成为稀缺资源。
当然最根本的变化,还是整个AI产业的商业逻辑变了。行业开始从烧钱换规模、亏损换用户,转向了盈利优先和精细化运营,定价权从用户端回归厂商端。
过去两年,整个AI行业处于疯狂扩张的阶段,大家的资本投入也多,厂商们靠着免费API、低价算力吸引用户从而占领市场。哪怕是AI业务持续亏损也无所谓,反正还有其他业务的利润支持,还有资本的资金来保障持续投入。
但是,进入2026年,风向就变了。资本投入趋于理性了,厂商们纷纷表示我们有盈利压力了,毕竟大老板说了:AI业务必须给我盈利。
所以,这样一来,我们就能理解为什么阿里云调整免费额度,开启按量付费,而腾讯云、百度智能云全链路调整价格。字节火山引擎则是利用内部规模效应降低成本,同时通过外部价格调整实现AI业务盈利,海外的OpenAI、Anthropic,则也通过价格调整兑现模型能力的价值。
参考亚马逊AWS历经14年的奋斗才跨过盈亏平衡点,阿里云则在2022年走向盈利。国内云厂商的价格战,早在 2014 年便已拉开帷幕,此后十余年间从未停歇,阿里云常年主动发起大规模降价,单次最高降幅超 50%,而腾讯云则始终快速跟进,甚至祭出比阿里云更低的报价,展开贴身肉搏式竞争。
据公开报道,腾讯云在过去很长一段时间里被视为集团的成本中心。为了在阿里云和华为云的激烈竞争中快速抢占市场份额,腾讯云长期采取了激进的低价策略,通过远低于成本的报价和长期不涨价的承诺来获取大客户订单。
而这种策略,虽然让腾讯云的营收规模快速做大,一度坐稳国内第二,但也会导致业务长期处于规模不经济的怪圈,也就是规模越大,亏损可能越严重。直到2025年,腾讯云业务才实现了全年规模化盈利。
毋庸置疑的是,随着AI算力需求的上涨,市场规模越来越大。但是,绝大多数云厂商却依旧是常年处于亏损状态。目前这几家除了市值突破4000亿港元的智谱,有资本底气来继续抬高价格,继续折腾,其他家几乎还在垂死挣扎。
在这样的大环境下,更不要说中小企业的生存了。
03 成本增加和账单反思
“我们这种小团队,没有自研模型,没有算力储备,只能依赖公有云API。”李然的声音里透着一丝无奈,“成本上涨后,要么调整价格,要么压缩利润。”
更现实的是,厂商们会把算力资源,优先分配给付费率高、用量大、毛利高的客户比如金融、政企、头部互联网企业等,中小企业不仅会增加成本,还可能面临资源分配的问题,获取稳定算力的难度也会有所增加。
这背后最受影响的反而是那些套壳应用,也就是没有任何技术壁垒,只是简单调用API做二次开发的企业和平台。“一旦成本上涨,它们的成本优势减弱,那就需要重新审视商业模式了。”前述投资人告诉「商业秀」。
对个人开发者来说,免费额度的调整同样也会带来影响,因为零成本试错的窗口关闭了。百度调整低阶模型的免费额度、字节调整豆包的免费额度,仅保留新用户短期额度(百度100万/90天、字节500万/30天)。
是时候需重新规划成本投入了。这种账单反思,也正在倒逼开发者从无脑调用转向精打细算,开始研究模型压缩、量化、上下文窗口优化、RAG检索增强,甚至说混合调用不同版本模型,这些只是为了降低Token消耗。
不过,这也需要时间和技术积累,对于很多中小团队来说,当务之急是重新规划公司的发展路径。李然决定看看研究一下各家的套餐,“组合叠加使用起来,会更划算。”
可以看到的是,这场价格调整,正在加速AI产业的分化。头部企业凭借全栈能力与规模效应,调整后仍能保持毛利,甚至通过资源优化进一步巩固市场份额。而中小厂商,尤其是无自研模型、无算力储备的中小AI服务商,成本增加无法传导,利润受到影响,需重新寻找发展路径。
不过,也会有例外,那些深耕垂直场景、有核心技术(如模型优化、成本管控)的中小厂商,反而可能在这场调整中跑出来。它们不需要依赖高端API,只要能在垂直场景中实现降本增效,就能找到自己的出路。
相信有很多人关注这场价格调整,有人认为厂商们逐利,让中小企业和开发者面临成本压力。但「商业秀」认为,这场调整也预示着AI产业正在走向成熟。毕竟,过去两年免费AI的补贴模式,让很多人误以为AI是免费的,也催生了大量无价值的应用,浪费了算力资源。而2026年的这场集体调整,本质上是市场在优化和淘汰无价值的应用,倒逼技术迭代。只有这样,才能让真正有价值的AI应用获得合理的商业回报。
算力可以走普惠路线,可以追求性价比。但没有厂商,能一直为爱发电。
这场调整对厂商们来说,也是商业逻辑的回归。接下来可以用成本+合理利润定价来实现AI业务的可持续盈利。对中小企业和开发者来说,它们除了要控制自己的成本,更要转向技术优化和深耕垂直场景。
AI从来都不是免费午餐。未来AI行业进入价值付费时代,只有真正能创造价值,做好成本管控的企业和开发者,才能不被时代抛弃,站稳脚跟活下去。







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论