谷歌Gemini算力计费引争议:用户配额异常消耗 负责人回应调查

2026.05.26 15:13
2026年5月17日谷歌Gemini改用算力计费,引发用户不满。部分AI Pro订阅用户在配额未用完时,一条简单视频请求耗尽5小时配额且失败。Gemini负责人Josh Woodward已启动调查,行业内AI服务正转向资源导向型计费,但透明度问题待解。

2026年5月17日,谷歌正式调整Gemini AI服务的计费模式——原有的每日提示词次数制被替换为按算力消耗计费,这一变动覆盖所有付费订阅用户,核心参考维度包括请求复杂度、功能调用及聊天历史长度。此举旨在更精准反映AI服务的资源消耗成本,但上线仅9天后,科技媒体Android Authority便报道称大量用户对新计费方式表示不满,部分用户遭遇配额异常消耗的问题。

AI大模型的推理成本主要由算力决定,不同类型的请求对资源的占用差异显著。例如,生成一段10秒的视频需要处理视觉帧序列和时序逻辑,其算力消耗通常是文字问答的5-10倍;而调用外部工具(如代码执行、实时搜索)或携带较长聊天历史的请求,会因模型需要加载更多上下文数据,导致单次推理的计算量增加30%以上。此前的次数制无法体现这种差异,让谷歌在处理高复杂度请求时承担了额外成本,调整计费方式也就成了必然。

谷歌的新计费模型把每个请求的算力消耗转化为“算力单位”:请求复杂度根据模型层级(如Gemini Ultra与Gemini Pro)和任务类型(生成式或理解式)设定权重;功能调用按调用次数和工具类型(如搜索API、代码解释器)累加算力;聊天历史每增加1000token,算力消耗约提升5%。用户订阅配额以“算力小时”计算,不同层级对应不同额度——比如每月20美元的AI Pro订阅用户,每月可使用100算力小时。

用户投诉的核心问题集中在透明度不足和成本不可预测。例如,一位AI Pro订阅用户在配额剩余60%时提交了一条仅含5秒视频素材的生成请求,系统显示该请求消耗5算力小时,最终视频生成失败且配额已扣除。这类案例反映出用户对算力消耗的预期与实际结果存在巨大偏差,而谷歌尚未提供详细的算力计算明细,让用户无法提前预估请求的成本。

Gemini负责人Josh Woodward在5月26日的声明中提到,团队已关注到用户反馈,正全面调查计费模型,重点核查视频生成任务的算力计算逻辑是否存在异常,同时承诺一周内公布调整方案,包括新增实时算力消耗预估功能和详细费用明细页面。

当前AI服务计费模式正逐步从次数制向资源导向型转变。例如,OpenAI在2025年底对GPT-4 Turbo采用“token+算力”的混合计费模式,用户可通过工具查看每个请求的token数和算力消耗;Anthropic的Claude 3则推出分层计费方案,针对不同复杂度的任务设置不同的算力系数。这些调整都是为了平衡成本与用户体验,但类似的用户投诉也时有出现,比如2026年初Claude 3用户反映长文档处理的算力消耗超出预期。

竞争对手方面,微软Copilot目前仍采用订阅制,但针对4K视频生成、10万字文档分析等高级功能推出了按次付费的附加服务,用户可按需购买;百度文心一言则采用“基础订阅+算力包”的组合模式,用户订阅基础服务后,能根据需求购买额外算力包,灵活性更高。相比之下,谷歌这次调整的计费模式缺乏弹性,没能给用户更多选择空间。

谷歌Gemini的计费调整虽符合行业趋势,但执行中的透明度缺失和模型优化不足影响了用户体验。AI服务提供商需要在成本控制与用户体验间找到平衡,通过更清晰的计费明细、实时预估功能和灵活的付费选项来提升用户信任。随着AI技术普及,算力计费模式会成为主流,但如何让用户理解并接受这一模式,仍是行业待解的关键问题。

作品声明:内容由AI生成