Meta押注“超级智能”:Muse Spark横空出世,扎克伯格的AI翻身仗打响了

AGI
扎克伯格曾公开承认自己对Meta AI进度不满意,并下定决心启动一场全面革新。

 在沉寂了将近一年之后,Meta终于端出了一道让行业侧目的大菜。

4月8日,Meta正式发布旗下最新旗舰AI模型 Muse Spark,将其定性为“从零开始的全面改造”——这是Meta全新成立的超级智能实验室(Meta Superintelligence Labs,下称MSL)对外发布的首个公开模型,也是扎克伯格为重夺AI桌上一席之地而打出的最重要一张牌。

Muse Spark的诞生,是Meta对自身AI战略一次彻底的自我否定与重构。

过去两年,Meta在AI赛道上的形象相当尴尬:Llama系列虽然凭借开源策略在生态圈积累了口碑,但无论是产品完成度还是模型性能,都被OpenAI的ChatGPT、Anthropic的Claude远远甩在身后。扎克伯格曾公开承认自己对Meta AI进度不满意,并下定决心启动一场全面革新。

过去9个月里,Meta重建了整个AI技术栈,包括训练基础设施、推理架构和数据策略。Muse Spark不是在旧基础上修修补补,而是真正意义上的“新生”。用Meta自己的话说,这是“我们扩展阶梯的第一步”——言下之意,Muse系列之后还有更多。

新大脑,新团队

重建的不只是技术,还有人。

去年,Meta宣布成立超级智能实验室,并以143亿美元投资入股AI数据公司Scale AI,获得49%股权,并任命Scale AI创始人Alexandr Wang 担任Meta首席AI官,主导这场重建工程。与此同时,Meta从OpenAI、Anthropic、Google大批挖角顶尖研究人员,以业界罕见的薪酬体系重组了AI核心团队。

这一系列动作的信号再明确不过:扎克伯格要玩真的了。

从独立第三方评测机构Artificial Analysis的数据来看,Muse Spark在综合智力指数(Intelligence Index)上得分52,全球排名前五,仅次于谷歌Gemini 3.1 Pro Preview、OpenAI GPT-5.4和Anthropic Claude Opus 4.6,大幅超越Meta此前最强模型Llama 4 Maverick(18分)。

具体能力维度上:

  • 视觉理解(MMMU-Pro):得分80.5%,全球第二,仅次于Gemini 3.1 Pro Preview的82.4%;
  • 推理与指令遵循(HLE评估):得分39.9%,位居第三;
  • 科学推理(CritPT物理研究题):得分11%,超越Claude 4.6 Sonnet(3%)和Gemini 3 Flash(9%);
  • “人类终极考试”(Humanity's Last Exam):借助外部工具时达到58.4分的高水准。

值得关注的是,Muse Spark在达到顶尖性能的同时,Token消耗效率极高,仅使用约5800万输出Token,与Gemini 3.1 Pro Preview相当,远低于Claude Opus 4.6的1.57亿和GPT-5.4的1.2亿。效率与性能兼顾,是Muse Spark在架构层面的重要突破。

Meta自己也坦承,在“长视野代理系统和编码工作流”领域仍存在一定差距,这也是未来需要持续补强的方向。

两种模式:快与深的平衡

Muse Spark上线后,Meta AI应用同步推出两种工作模式:

  • 即时模式(Instant):针对日常对话和简单问题,追求快速响应;
  • 沉思模式(Contemplating):面对复杂任务时启动,可协调多个AI子智能体并行推理,在保持相近延迟的同时大幅提升输出质量。

这种“多智能体并行”的架构设计颇具新意。以旅行规划为例,模型可以同时完成行程规划、目的地对比、活动筛选等多个子任务,最终整合输出一份完整方案,效率和精度均远超传统单链式推理。

Muse Spark是一个原生多模态模型,支持文本、图像等多种输入形式,具备真正的跨模态理解与交互能力。

在应用场景上,Meta着重布局了两个垂直方向:

健康领域:Meta专门与超过1000名医生合作优化训练数据,使模型在处理医疗建议类问题时具备更高的专业性与安全性。这一举措信号明显——Meta正在将AI定位为“个人健康助手”,而非单纯的信息检索工具。

视觉STEM(科学、技术、工程、数学):模型在处理视觉化科学与工程问题上表现出色,用户可以通过拍照或描述来排查家用电器故障、生成交互小游戏,甚至实时理解技术图纸。

此外,Muse Spark还可接入用户在Instagram、Facebook、Threads等平台分享的内容,提供个性化推荐,并在Meta AI眼镜上实现更强的环境感知能力——这是Meta“具身AI”战略的重要组成部分。

这或许是Muse Spark发布中最微妙、也最值得关注的一个信号。

Meta曾是开源AI生态的旗手,Llama系列开放权重下载,催生了全球数以万计的开发者应用。然而,Muse Spark首发时选择了闭源——仅通过meta.ai和Meta AI应用提供,API仅向部分合作伙伴开放私有预览,普通开发者无法直接调用。

扎克伯格表示,未来仍计划发布“越来越先进的开源模型”,但Muse Spark本身暂不开源。

这一转变意味着什么?一种解读是:Meta已意识到,在前沿模型的军备竞赛中,“开放”固然可以扩大生态,但也意味着提前曝光核心能力、让竞争对手借鉴领先技术。在真正建立性能优势之前,Meta选择先“守住底牌”。另一种解读则更为商业:Meta需要通过闭源API变现,为每年数百亿美元的AI投入找到可持续的商业回报。

两种逻辑并不矛盾,但都指向同一个方向:Meta正在从理想主义的开源布道者,向务实的AI商业玩家悄然转型。

“个人超级智能”:扎克伯格想要的,远不止一个聊天机器人

在发布声明中,扎克伯格将Muse Spark定位为通往“个人超级智能”愿景的第一步。这个词汇的选用绝非随意——它对应的是Sam Altman口中“AGI”概念的Meta版叙事,暗示Meta的野心在于打造一个真正能够替代人完成任务的AI代理(Agent),而非只是一个回答问题的聊天工具。

按照这一战略路线,Meta未来的AI产品将嵌入用户的全平台数字生活:Instagram的内容推荐、WhatsApp的日程管理、AR眼镜的实时视觉辅助……Meta拥有全球最庞大的社交用户基础,这是OpenAI和Anthropic无法复制的独特资产。

当然,这也伴随着隐私风险。目前,使用Muse Spark需要通过Facebook或Instagram账号登录,Meta的惯常做法是利用公开用户数据进行模型训练。随着AI深度融合个人社交数据,用户隐私边界如何界定,将是监管机构和公众长期关注的议题。

Muse Spark的意义,不仅仅在于一个模型的性能数字。

它更深层的含义是:Meta终于重新站上了前沿AI的牌桌。在过去一年里,OpenAI凭借GPT-5系列、Anthropic凭借Claude 4系列、谷歌凭借Gemini 3系列,分别巩固了各自的行业地位。而Meta一直以一个“追赶者”的姿态出现,甚至一度被调侃为“AI时代的局外人”。

Muse Spark改变了这一叙事。52分的综合评分,视觉理解全球第二,Token效率业界领先——这些数字证明,经过9个月的彻底重建,Meta已经具备了与顶尖AI公司正面交锋的技术实力。

更重要的是,Meta有其独有的护城河:35.8亿日活用户、跨平台的社交数据网络、AR眼镜等硬件生态,以及在消费级AI产品上的多年沉淀。一旦模型能力与平台生态真正融合,Meta在AI应用层的爆发力,可能远超今天市场的预期。

这场AI翻身仗,才刚刚开始。(本文首发钛媒体APP,作者 | 硅谷Tech_news,编辑 | 秦聪慧)

作品声明:内容由AI生成
本文系作者 硅谷Tech news 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App