2026年6月30日凌晨,Runway在X上发了一条简短的消息。与日本最大的游戏、体育和娱乐综合集团之一MIXI达成战略合作,全公司范围内部署Runway,共同探索世界模型在游戏、动画和交互体验中的新兴应用。
表面上看,这不过是又一家AI公司与一家游戏公司的合作签约。但如果把这条消息放在2026年世界模型赛道的坐标下看,它至少释放了三层信号:世界模型正在从“视频生成”走向“交互式体验引擎”;日本顶级游戏公司开始认真考虑用AI重新定义游戏生产方式;以及,Runway正在完成从“好莱坞工具商”到“游戏基础设施提供商”的身份跃迁。
MIXI是谁?Runway赌上了什么?
先看MIXI。
在日本游戏市场,MIXI是一个绕不开的名字。它的王牌产品《Monster Strike》(怪物弹珠)自2013年上线以来,全球累计营收超过72亿美元,Sensor Tower的数据显示它是App Store和Google Play双平台史上收入最高的移动应用,超过了《智龙迷城》和《Pokémon GO》。即使在2026年,这款手游在日本App Store收入榜上依然是常客,过去三年里有962天稳居前十。
但MIXI远不止一家游戏公司。2026年6月刚提交的FY2027财报显示,截至2026年3月31日的财年,MIXI实现营收1713.69亿日元,约合10.6亿美元,同比增长10.7%。数字娱乐业务贡献约940亿日元,体育业务贡献约400亿日元,后者包括职业体育队运营和体育博彩服务。2025年9月,MIXI收购了澳大利亚上市公司PointsBet,将全球体育博彩业务进一步扩展。
换句话说,MIXI是一家业务横跨游戏、体育赛事运营、体育博彩和社交娱乐的综合性娱乐集团。它拥有的游戏IP、体育赛事场景和亿级用户数据,几乎是世界模型从“视频生成”进化到“交互式模拟”最理想的试验场。
再看Runway。
这家总部在纽约的AI公司最初以AI视频生成工具闯入行业视野。奥斯卡获奖电影《瞬息全宇宙》的视觉特效团队使用Runway完成了关键场景的背景抠像,这让它在好莱坞一战成名。但Runway从未满足于做一家“视频工具公司”。
2025年12月,Runway发布了首个世界模型系列GWM-1(General World Model-1),包含三个子模型。其中GWM Worlds允许用户通过实时输入探索并影响AI生成的数字环境,模型能保持跨长序列运动的一致性,据称可持续数分钟的连贯交互。这在当时是视频生成公司中第一个公开可用的世界模型产品。
2026年2月,Runway完成3.15亿美元Series E融资,由General Atlantic领投,NVIDIA、Fidelity、Adobe Ventures、AMD Ventures等参投,估值达到53亿美元,几乎是去年Series D时33亿美元估值的两倍。迄今总融资额达8.6亿美元。
TechCrunch在2026年5月的报道中引用了Runway联合CEO Anastasis Germanidis的判断:“训练模型直接基于对世界的观察数据,是AI的下一个前沿。”同一篇报道透露,Runway在游戏和机器人领域的企业采用正在快速增长。2026年6月,Runway宣布将伦敦设为欧洲总部,计划到2028年向英国AI生态系统投资超过2亿美元。
世界模型赛道已经挤满了玩家,游戏为什么这么难啃?
世界模型这个概念在2026年已经不算冷门。它指的是能够模拟环境并预测其行为的AI系统,不仅能生成逼真的画面,还能理解物理规则、因果关系和时间连续性。
这条赛道上挤满了最有实力的玩家。Google DeepMind推出了Genie 3,能够从文本提示直接生成720p分辨率、24fps的实时交互式3D环境。Yann LeCun离开Meta后创立的AMI Labs以5亿欧元的融资规模和30亿欧元的估值杀入赛道。Fei-Fei Li的World Labs推出了Marble,以免费到每月95美元的定价向商业用户开放。NVIDIA的Cosmos平台下载量突破200万次,成为机器人公司和自动驾驶公司的核心训练数据生成工具。
但游戏行业一直是世界模型最难啃的骨头。原因很简单:游戏对交互实时性、一致性和可控性的要求远超影视内容。一段AI生成的视频可以有几帧瑕疵,观众不太会注意到。但一个AI驱动的游戏世界必须有可预测的物理规则、可重复的交互逻辑、玩家操作与画面反馈之间无缝的同步。这是当前所有世界模型都尚未完全解决的问题。正如行业分析所指出的,纯粹的世界模型在同步多个玩家之间的世界状态变化和持久性方面存在固有挑战。
所以当MIXI宣布在全公司范围内部署Runway并探索世界模型在游戏中的应用时,这不仅仅是一个试试看的POC项目。MIXI的数字娱乐业务年营收近10亿美元,拥有亿级用户基数的游戏IP。它投入资源去做的事情,大概率是经过深思熟虑的战略选择。
Runway的“产品优先”路径为什么对游戏公司有吸引力?
Runway进入游戏行业的路径与Google、NVIDIA或World Labs有本质区别。
Google的Genie 3是研究驱动的,DeepMind的核心定位是发论文和出demo,证明世界模型能做什么。NVIDIA的Cosmos是基础设施驱动的,它卖的是训练数据生成平台,主要客户是机器人公司和自动驾驶公司。World Labs的Marble是工具驱动的,让设计师可以用世界模型快速做空间设计原型。
而Runway的路数是“产品加企业”双轮驱动。
Runway从一开始就在做面向专业创作者的产品。它的Gen-4视频生成模型已经迭代到4K分辨率、完整的角色一致性控制和Aleph视频编辑器等专业功能。它和Adobe达成了合作,其技术已经嵌入创意工作流。在好莱坞,它不是实验室demo,而是被奥斯卡获奖电影实际使用过的生产工具。
这种被专业用户验证过的履历,在游戏行业格外重要。游戏公司对工具的稳定性、可控性和可集成性有着近乎苛刻的要求。一个不可控的AI工具,对游戏开发流程而言不是效率工具,而是灾难。MIXI选择Runway,不是因为Runway的世界模型在论文benchmark上跑分最高,而是因为它已经证明了自己能做出让专业人士在商业生产中使用的产品。而GWM-1 Worlds这个子模型的实时交互特性,让用户通过实时输入影响生成画面,恰好是游戏场景所需要的核心能力。
更深一层看,Runway的世界模型技术路线本身就与游戏天然兼容。AI视频生成的本质是“预测下一帧”,而游戏引擎的本质是“根据玩家输入计算下一帧”。两者在“让画面动起来”这个层面是同构的。世界模型如果能在保持物理一致性的前提下接受玩家输入,它就是一个不需要传统图形渲染管线的、AI原生的游戏引擎雏形。
日本巨头为什么在这个时间点all-in?
MIXI不是第一家拥抱AI的日本游戏公司,但它的姿态比绝大多数同行都激进得多。“在全公司范围内部署Runway”这句话的潜台词是MIXI不是在做一个实验性的AI项目,而是要把AI嵌入从游戏开发、动画制作到交互体验设计的全部环节。
这背后的驱动力有三重。
第一重是成本与效率压力。日本游戏开发的人工成本居高不下,而全球游戏市场的竞争正在加剧。Monster Strike虽然是常青树,但手游市场的生命周期规律不容忽视。MIXI需要找到新的增长引擎,AI可能是成本最可控的路径。
第二重是IP价值最大化。MIXI拥有的游戏IP、体育IP和用户数据是稀缺资产。世界模型可以将这些IP转化为交互式体验,以自然语言走进一个Monster Strike的世界,或者观看一场AI实时生成的体育赛事。世界模型天然适合做IP的“体验化”延伸,这是传统游戏引擎做不到的事情。
第三重是日本AI产业的政策窗口。2026年日本政府对AI产业的支持力度空前。Runway刚刚在伦敦投资超2亿美元设立欧洲总部,MIXI与Runway的合作也可能是Runway亚洲战略的关键落子。对于一家估值53亿美元、正从视频赛道向游戏和机器人扩张的AI公司来说,拿下日本头部游戏公司作为标杆客户,战略价值远高于合同金额本身。
更深层地看,这反映了日本科技产业在AI浪潮中的一次关键转型:从“等待技术成熟”到“主动拥抱前沿”。MIXI在全球游戏市场的地位让它有底气做出这样的战略选择,而Runway的产品成熟度也让这次合作有了实质性基础,而非简单的PR动作。
世界模型的“游戏入场券”拿到了,但比赛才刚刚开始
这次合作最值得关注的是什么?不是MIXI买了几套Runway的licenses,也不是Runway拿下了多少金额的合同。而是世界模型第一次真正进入了“游戏工业生产流程”。
在此之前,世界模型的应用场景主要集中在影视概念设计、机器人训练仿真和空间设计原型。游戏行业的AI应用大多停留在AI生成贴图、AI辅助策划、AI驱动的NPC对话,这些本质上是“辅助性”的。而世界模型的核心承诺是:让AI直接生成可交互的游戏世界。
如果这个承诺在MIXI的实践中被验证为可行,那么日本游戏行业乃至全球游戏行业将面临一次范式级的变革。传统的游戏引擎不再是唯一的核心基础设施。世界模型将成为新的“游戏引擎”,输入一段文本描述,生成一整个世界。
当然,技术挑战仍然巨大。世界模型的连贯性、可控性和多用户一致性等问题远未完全解决。GWM-1能保持数分钟的连贯,但大型游戏需要的是数小时、可持续存档和回放的世界。从“数分钟”到“数小时”,是从demo到产品之间最远的距离。
但方向已经明确了。当一家年营收超过10亿美元、手握史上最赚钱手游IP的日本娱乐巨头宣布与世界模型公司展开深度合作时,行业需要认真对待这个信号。世界模型不再是AI视频的附属品,它正在成为下一代交互体验的核心基础设施。而游戏,就是第一个被撬开的战场。
Runway赌的不只是MIXI的项目能做成。它赌的是一个更大的逻辑:在未来,每一款游戏都可能需要一个世界模型。而这个模型,可能不再由Unity编写,也不再由Unreal渲染,而是由输入的一句话开始生成。






快报