火山引擎正在批量生产Opus4.6

AGI
68 块用 SOTA?

文 | AI唱反调

68块钱买到一个号称对齐Claude Opus的旗舰模型,听起来像割韭菜的PPT,也像某种我们还没习惯的新常态。 

这或许就是国产AI互相竞争对于用户的福利。

昨天火山引擎在FORCE大会上,总裁谭待甩出了豆包2.1 Pro、Seedance 2.5、Seedream 5.0 Pro和音频模型1.0一堆牌。今天豆包专业版就上线了,标准套餐68元一个月。这不是国产模型第一次摸到Opus4.6的门槛,但风评清一色是:豆包也配收费?

事实上,豆包不仅配,它背后的火山引擎正在多个模态批量生产Opus级别的领先大模型。

这笔账不亏,却也没那么香

先算清楚68元到底买到什么。

谭待在会上的原话是:只有当模型能力跨越"质变点",才能真正满足生产场景需求。全球范围内,Coding与Agent领域第一个跨过这道门槛的是Claude Opus 4.6。而6月13日,智谱GLM-5.2已经先行一步,在Code Arena上拿下全球第二,官方口径称其与Claude Opus 4.8处于可比区间。豆包2.1 Pro则是又一个跨过这道门槛的国产玩家。

官方给出的评测数据里,Terminal Bench 2.1、SWE-Pro、SciCode等代码评测进入全球第一梯队,OSWorld、MobileWorld、MMMU-Pro等Agent与多模态评测也位居全球前列。在芯片设计RTL的实战测试中,豆包2.1 Pro连续运行近18小时,经历9轮迭代,跑通了仿真、测试、综合检查等完整工程流程。

这模型不会让人感叹"哇好聪明",只会让人惊觉"上周我干了两天,它十分钟就搞定了"。

68元专业版打包的能力很实在:操作本地电脑和浏览器、跑复杂Agent任务、内置Office套件、生成带后端数据库的在线应用。这些原本是企业级服务的配置,现在下放到个人订阅里。横向看,ChatGPT Plus和Claude Pro的基础订阅换算过来普遍在145元上下,而且那往往只是"入场券",真想调用Opus 4.6级别的满血能力,按Token另算,一个重度开发者或产品经理,每个月烧掉几百到上千美元不稀奇。豆包这边,68元标准版底层接的就是2.1 Pro,还把这些生产力工具一并打包。

但这68块的锁法有点诡异。免费用户只能体验Turbo版的办公任务模式,Pro模型被锁在专业版里。它先让你用免费版感受到"AI能帮我干活"的甜头,等你真打算拿它处理复杂项目时,发现Turbo不够用,自然就得掏更多钱。这更像是用户筛选,面向那些已经打算拿AI真干活的人,先把他们绑进来。对火山引擎来说,这些付费用户产生的真实任务数据,恰恰是在帮它打磨企业级Agent能力的边界。

字节做的未必好看,却极准

说它是烧钱补贴,这是最直觉的解读,大概率也是错的。

豆包2.1 Pro的综合使用成本只有Claude Opus 4.6的20%,这是量化、蒸馏、推理调度、自研芯片一层层压出来的结构性优势。卖68元,大概率还有利润空间,谈不上赔本赚吆喝。这属于成本本来就低,卖这个价是正常商业定价,甚至还能赚钱。

海外玩家在做单点突破定义规则,豆包在做全模态覆盖和落地速度。昨天五大模型齐发,没有"发布等半年适配"的空窗。Seed2.1当天就推到豆包App和TRAE,API同步走火山方舟全量开放。豆包音频生成模型1.0发布的同时,就明确要接入剪映、即梦、番茄。Seedance 2.5预计7月正式上线,主打30秒单段原生视频直出、50个全模态素材联合生成。Seedream 5.0 Pro也在同一天亮相,支持分图层编辑和14种语言图内文字精准排版。

真正的重点在于:流水线能把厉害的模型在24小时内变成你手机里的一个按钮。火山方舟平台日均Token调用量已经突破180万亿,过去一年增长超10倍。模型一上线就接触海量用户的真实场景,用户怎么提问、怎么纠错、怎么骂它笨,数据立刻回流,下一代模型迭代更快。从实验室到产品的链路,被压缩到最短。

这些高周转的Token,加上豆包、剪映、番茄、飞书几亿用户每天产生的真实数据,构成了火山引擎可以批量生产SOTA模型的根本。视频领域也是如此,Seedance 2.0至今仍是全球视频生成赛道的第一梯队,2.5紧接着就推出来了。这种迭代密度,靠的不是某个天才研究员的灵感,而是数据飞轮转起来后的惯性。

但硬币总有另一面。豆包音频模型"即将上线剪映、即梦、番茄",所有AI发布都服务于内容生态。模型迭代方向不可避免地被现有场景的需求牵引,优化越来越倾向"视频转码要快""小说润色要顺""办公自动化要稳",很少留给"边界探索"这种暂时看不到商业回报的方向。跑得快,有时也意味着抬头看路的时间变少了

工厂的噩梦

成本砍80%靠工程优化。这很了不起,但工程优化是可以被追赶的。

同一天,京东开源了JoyAI-VL-Interaction,百度开源了Unlimited-OCR,网易有道开源了Confucius4-TTS。国内厂商的工程化能力都在快速迭代,极致降本不是火山引擎独占。京东的JoyAI-VL-Interaction在58个真人盲评中,对比豆包视频通话助手胜率77.6%,对比Gemini视频通话助手胜率87.9%。这说明国内其他玩家也在快速逼近,甚至局部反超

字节在当全行业的超级工厂。工厂当然重要,没有量产就没有普及。但工厂的噩梦永远是:一旦技术扩散,比拼就回到谁的地基更深

OpenAI发布GPT-5.5-Cyber定义网络安全标准,Anthropic推出Claude Tag定义企业Agent协作范式。它们争的是"什么叫正确的Agent","谁更便宜"从来不是核心议题。字节在工厂里跑得再快,天花板还是别人画的。

一旦规则制定者也把成本打下来,把能力下沉,比拼的终局还是会回到底层能力的代差,而非生产效率的高低。当海外巨头完成推理成本下探,把顶级模型的价格打到大众消费区间,68元的价格锚点将面临直接挑战。

用户为68元涌进来不难,难的是让他们下个月还续。对手做到同价位只是时间问题,迁移成本没有想象中那么高。换个API key比换手机号容易多了。

结尾

火山引擎把Opus 4.6级别的能力干到了68块钱一个月,已经给国内大模型行业带来了实打实的价格压力。没有自研推理优化能力的厂商,会被加速挤出通用大模型的主赛道。

效率能赢下上半场,终局咬住用户的,不会是价格锚,只能是长进用户骨头里的workflow。剪映、飞书、火山引擎的协同网是个好篱笆,但篱笆挡不住对手也降价。真正让人留下来的是:你的项目文件存在飞书文档里,你的视频素材在剪映里做了AI配音,你的代码仓库接的是火山方舟的API,一旦抽离,整个工作流会断裂。

便宜只能赢一次,好用才能赢一辈子

本文系作者 AI唱反调 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

17:14

恒逸石化:预计上半年度净利润55亿元-60亿元,同比增长2326%-2547%

17:13

两部门:坚持“减量置换”原则严格控制炼油产能规模,引导大型企业、重点区域炼油能力优化重组

17:13

两部门:“十五五”实现原油年产量稳定在2亿吨水平,天然气产量稳步增长

17:12

两部门:强化可控核聚变、太空电站、高温超导输电等理论研究和技术创新,加强大型新能源基地与国家算力枢纽协同布局

17:11

两部门:因地制宜推广煤炭绿色开采,稳步推进煤炭行业甲烷控排

17:11

两部门:加快钢铁、有色、石化、化工、建材等传统产业转型,推广电锅炉、电加热、电辅热炉窑等

17:10

两部门:合理规划建设天然气电站,加大国产化燃机示范及推广应用

17:08

两部门:到2030年车网互动聚合可调充电规模达到5000万千瓦左右

17:08

两部门:打造重要能源产品骨干流通走廊,新增西电东送能力8000万千瓦以上

17:07

两部门:推动配电网向源网荷储资源高效配置平台转变,2030年力争具备承载9亿千瓦分布式新能源接入能力

17:07

两部门:2030年常规水电装机达到4.1亿千瓦左右

17:06

深交所:因2026年香港特别行政区成立纪念日假期,7月1日不提供港股通服务

17:05

两部门:到2030年抽水蓄能装机达到1.6亿千瓦左右,新型储能装机达到3亿千瓦

17:05

两部门:2030年新能源发电量占比达到30%

17:04

两部门:到2030年初步建成清洁低碳安全高效的新型能源体系

17:02

证监会同意富士达沪主板IPO注册

17:00

霍尔木兹海峡重开增加供应,布伦特原油抹去战时全部涨幅

16:59

艾灵发布具身智能工业5G通信底座方案

16:58

传音控股发布Hi Translate 6.0

16:55

英国钢铁进口免税配额将削减51%,新规7月1日生效

扫描下载App