![]()
图片由AI生成
在历经“卷”价格争议、DeepSeek冲击波、Agent元年、端侧AI爆发后,豆包大模型又迎来了一次重要更新。
12月18日,火山引擎正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。
据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。
火山引擎称,权威评测数据显示,最新版大模型在Agent能力、多模态理解等方面已跻身全球第一梯队。
针对日益增长的视频创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型。据其介绍,该模型具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进展。
目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可通过火山引擎API接入Seedance 1.5 pro模型服务。
多模态能力增强,Agent进入“真干活”阶段
尽管多模态大模型需求旺盛,但行业仍处于早期,技术限制尚未完全突破,谭待也在会后的媒体采访中表示,需保持耐心,模型会持续进化并逐步解锁新领域,这是模型成为“复杂智能体”的必经之路。
“Agent能力”则是这场发布的重头戏,几乎贯穿了这次豆包大模型的发布全程。
在谭待看来,多模态意味着模型开始真正进入复杂应用场景,特别是企业场景,这是Agent成立的前提条件。
作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。
豆包1.8在Agent方面的“工具调用”能力进步显著,可一次性调用20多个工具,完成跨平台比价、OA审批、数据填报等长链条任务,平均规划步骤降低37%,执行成功率提升21%。
另外,最新的豆包大模型在复杂指令遵循能力和OS Agent能力都实现了大幅增强。
在多模态理解方面,豆包1.8大幅提升了视觉理解的基础能力,可以低帧率理解超长视频;在视频运动理解、复杂空间理解、文档结构化解析能力上也都有所提升。
豆包1.8还原生支持智能上下文管理。用户可以配置上下文策略,当任务轮次过长时,模型会根据策略智能清除低价值的历史工具调用信息,确保多步骤任务稳定完成。
在火山引擎公布的Agent能力公开测评中,豆包1.8在数学、推理、复杂指令遵循、通用体智能、智能体编程等多项测试上都与GPT-5High、Gemini 3 Pro、Claude Sonnet 4.5等全球领先的大模型在同一水平线上。
其中,在通用体智能BrowseComp-en方面,豆包1.8得到67.6分,不仅较上一代豆包1.6的16.7分大幅提升,也高于其他大模型。
![]()
图片来自火山引擎官方
Agent规模化爆发后,需要新运营和管理系统
自去年起,AI产业一度迷茫于找不到除了聊天机器人外的能提供实际价值的应用场景,呼唤“Agent时代”的声音愈发高涨。
在谭待看来,从中国的视角出发观察,“今年算是Agent元年,明年肯定还会继续爆发”。他还提到,目前AI帮助人们去做PPT甚至短剧、漫剧的尝试已经非常多,只是品质还不够,预计明年品质会很快得到提升。
在Agent的行业应用与客户拓展上,谭待发现,互联网、零售、汽车、教育等领域进展较快,而传统行业起步慢但天花板高。企业客户消耗大部分token,但个人用户数量占主导。
“Agent不只是开发问题,而是一个需要长期运营和管理的新系统。”谭待表示,而目前来说,最大的挑战不是模型能力,而是Agent的开发和迭代速度远远跟不上模型能力的提升。
实际上,在今年的大模型竞赛中,尤其是年底阶段,Agent能力已是重中之重,“从会聊天到会干活”“有高智商也要有高情商”的特质,愈发受到关注。
各大主流玩家中,Anthropic的Claude不断打磨精进着编程能力,已成为实际场景应用的典型案例之一。11月,谷歌重磅发布的Gemini 3也在实用性、性价比方面大受好评。
年初引发全球追逐的DeepSeek,在12月初最新发布的DeepSeek-V3.2中,着重强调了其在通用Agent任务中的表现,其更新的API还首次支持了在思考模式下使用工具调用能力,大大提升了用户获取到的答案的丰富度和适用性。
上周,OpenAI在公司十周年之际发布的“翻身之作”GPT-5.2,虽然从反馈来说褒贬不一,但其聚焦实际应用场景、专业用途,着力于凸显“经济价值”的方向仍然引发关注,一度获封“最强打工人”,从这家最初推动大模型浪潮的公司押注的方向,也能看出产业的风向所在。
“大模型最大的价值肯定不只是帮人写打油诗,合成一些照片。它最大的价值还是在教育、医疗、科研等方面,更好地帮助人成长,这也是大家对AI最大的期许。”谭待对媒体表示。
Agent即将爆发已经是行业共识,谭待关心的是,后续Agent的管理问题。![]()
火山引擎总裁谭待,图片来自火山引擎官方
他称,2024年,一个企业可能有50多个Agent,2025年增加到200多个,明年肯定会更多,这就需要提高管理、运营尤其是协同的能力。他也表示,助力企业管理好Agent也是火山引擎相关产品的关注和发力重点。
火山引擎已升级了企业级AI Agent平台AgentKit,覆盖了Agent从开发、部署到管控的生命周期,解决企业在Agent落地中面临的身份权限管理、模型确定性及系统集成等核心挑战。
在Agent运营层面,火山引擎推出了HiAgent智能体工作站,构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体,并支持个性化定制。
2025年,关于“Agent元年”的争论和实践,已收官在即,如果明年Agent爆发进一步爆发,能带来直接收益的实用场景和企业订单大幅增长,想必各家大模型厂商的竞争也将愈发激烈。(作者|胡珈萌,编辑|李程程)







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论
个人能在剪映用 Seedance,企业靠 API 接入,不同用户都能用上这模型
豆包 1.8 在 OS Agent 能力上也增强了,多项测评能跟全球顶尖模型比
Seedance 1.5 pro 能搞影视级叙事,音画同步还有突破,做视频的有福了
现在是 Agent 元年,可开发迭代速度跟不上模型能力,这问题挺头疼
火山引擎发了豆包大模型 1.8,还有 Seedance 1.5 pro,这次更新力度真不小
豆包 1.8 的工具调用能力进步大,长链条任务都能完成,复杂指令也能懂
豆包大模型现在日均 token 使用量超 50 万亿,比之前涨了 10 倍,用的人越来越多
明年要是 Agent 爆发,大模型厂商竞争肯定更激烈,有的忙了
Agent 不只是开发的事,长期运营管理更重要,好多企业还没理顺
豆包 1.8 多模态理解里,视觉能力提升不少,还能智能管理上下文