谷歌Gemini算力计费引争议：用户配额异常消耗负责人回应调查

2026年5月17日谷歌Gemini改用算力计费，引发用户不满。部分AI Pro订阅用户在配额未用完时，一条简单视频请求耗尽5小时配额且失败。Gemini负责人Josh Woodward已启动调查，行业内AI服务正转向资源导向型计费，但透明度问题待解。

2026年5月17日，谷歌正式调整Gemini AI服务的计费模式——原有的每日提示词次数制被替换为按算力消耗计费，这一变动覆盖所有付费订阅用户，核心参考维度包括请求复杂度、功能调用及聊天历史长度。此举旨在更精准反映AI服务的资源消耗成本，但上线仅9天后，科技媒体Android Authority便报道称大量用户对新计费方式表示不满，部分用户遭遇配额异常消耗的问题。

AI大模型的推理成本主要由算力决定，不同类型的请求对资源的占用差异显著。例如，生成一段10秒的视频需要处理视觉帧序列和时序逻辑，其算力消耗通常是文字问答的5-10倍；而调用外部工具（如代码执行、实时搜索）或携带较长聊天历史的请求，会因模型需要加载更多上下文数据，导致单次推理的计算量增加30%以上。此前的次数制无法体现这种差异，让谷歌在处理高复杂度请求时承担了额外成本，调整计费方式也就成了必然。

谷歌的新计费模型把每个请求的算力消耗转化为“算力单位”：请求复杂度根据模型层级（如Gemini Ultra与Gemini Pro）和任务类型（生成式或理解式）设定权重；功能调用按调用次数和工具类型（如搜索API、代码解释器）累加算力；聊天历史每增加1000token，算力消耗约提升5%。用户订阅配额以“算力小时”计算，不同层级对应不同额度——比如每月20美元的AI Pro订阅用户，每月可使用100算力小时。

用户投诉的核心问题集中在透明度不足和成本不可预测。例如，一位AI Pro订阅用户在配额剩余60%时提交了一条仅含5秒视频素材的生成请求，系统显示该请求消耗5算力小时，最终视频生成失败且配额已扣除。这类案例反映出用户对算力消耗的预期与实际结果存在巨大偏差，而谷歌尚未提供详细的算力计算明细，让用户无法提前预估请求的成本。

Gemini负责人Josh Woodward在5月26日的声明中提到，团队已关注到用户反馈，正全面调查计费模型，重点核查视频生成任务的算力计算逻辑是否存在异常，同时承诺一周内公布调整方案，包括新增实时算力消耗预估功能和详细费用明细页面。

当前AI服务计费模式正逐步从次数制向资源导向型转变。例如，OpenAI在2025年底对GPT-4 Turbo采用“token+算力”的混合计费模式，用户可通过工具查看每个请求的token数和算力消耗；Anthropic的Claude 3则推出分层计费方案，针对不同复杂度的任务设置不同的算力系数。这些调整都是为了平衡成本与用户体验，但类似的用户投诉也时有出现，比如2026年初Claude 3用户反映长文档处理的算力消耗超出预期。

竞争对手方面，微软Copilot目前仍采用订阅制，但针对4K视频生成、10万字文档分析等高级功能推出了按次付费的附加服务，用户可按需购买；百度文心一言则采用“基础订阅+算力包”的组合模式，用户订阅基础服务后，能根据需求购买额外算力包，灵活性更高。相比之下，谷歌这次调整的计费模式缺乏弹性，没能给用户更多选择空间。

谷歌Gemini的计费调整虽符合行业趋势，但执行中的透明度缺失和模型优化不足影响了用户体验。AI服务提供商需要在成本控制与用户体验间找到平衡，通过更清晰的计费明细、实时预估功能和灵活的付费选项来提升用户信任。随着AI技术普及，算力计费模式会成为主流，但如何让用户理解并接受这一模式，仍是行业待解的关键问题。

谷歌Gemini算力计费引争议：用户配额异常消耗 负责人回应调查

谷歌Gemini算力计费引争议：用户配额异常消耗负责人回应调查