资本与产业界正迅速达成共识:AI正在从虚拟世界迈向物理世界,而世界模型这套让机器真正理解物理规律、预测状态转移的底层认知引擎,是这条路上最关键的一块拼图。
据 Morgan Stanley 于 2025 年 4 月发布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》报告预测,世界模型所对应的下游产业——从具身智能到自动驾驶到工业仿真——全球总市场规模将在 2050 年达到 5 万亿美元量级。
当整个行业还在争论世界模型该怎么做的时候,一支从北大走出来的年轻团队——逆矩阵科技,带着对于世界模型路线独特的思考,走进了我们的视野。
”做世界模型,最核心的问题是:模型学到的到底是相关性,还是因果?”
“如何在隐空间里真正学到物理因果,而不只是一个视觉上说得过去、物理上随时会失效的假设,是我们最想解决的问题。”
“世界模型必须引入主动干预,通过行动验证因果,而不是从旁观中拟合相关性。”
“我们不是把物理规律显性地写进模型,而是通过物理上可验证的方法,让模型自然地涌现出对物理的理解。”
……
这些观点正来自于逆矩阵科技的联合创始人——陈博远,而他的另一个身份则是北大元培学院22岁的应届毕业生。
陈博远在大一时就中稿了AI三大顶会之一的NeurIPS,本科生在此发文本就极为罕见。此后几年,他又陆续拿下NeurIPS Oral(口头报告,全球录取率不足0.5%)和ACL最佳论文(全球仅4篇,国内学术机构首篇独立完成)。毕业前,他已是北大学生年度人物和北大五四奖章得主,这是北京大学给予学生的两项最高荣誉。
![]()
他与同出北大的师兄吉嘉铭一起创立了逆矩阵科技,做通用世界基座模型。吉嘉铭同样是2025北大学生年度人物,也是极少数同时获得苹果、腾讯、蚂蚁三家顶级科技企业认可的青年研究者——2025年Apple Scholar(苹果学者,全球遴选,中国大陆仅2位)、首届腾讯青云奖学金、蚂蚁Intech奖学金(全球共10名)。
2026年3月,公司完成超千万美元天使轮融资,由高瓴创投和北大系基金燕缘创投联合投资。近期获悉,他们又将完成新一轮融资。
近日,我们与陈博远围绕世界模型和他的成长经历进行了一次深入的对谈。
▎以下为与陈博远的对话全文,略有删减:
创投家:世界模型现在非常火,从逆矩阵的角度是怎么理解这件事的?
陈博远:现在世界模型很火,可以说Anything is world model(一切皆世界模型)。但其实世界模型这个概念最早就是从强化学习和控制理论里来的。
1990年图灵奖得主、强化学习之父 Richard Sutton 提出 Dyna 架构,指出模型需要预测环境如何响应智能体的行动,再到后来2018年 David Ha 和 Schmidhuber 发表了一篇名为 World Models 的文章,指出智能体使用世界模型学习策略,并且在自己产生的梦世界中利用交互学习世界模型。
回到第一性原理。AI一定会从虚拟世界走向物理世界,而在物理世界里,核心是Interaction——交互。人类是怎么理解世界的?端起一个水杯大概三步:理解世界——什么是水杯,什么是桌面;编码到脑子里——隐空间;执行策略——不断尝试,失败了更新自己的信念。所以我们最终需要的世界模型,其实是一个状态转移模型——基于当下状态采取什么action(动作),触发什么next state(下一状态)。这个东西,强化学习研究了几十年。
创投家:你们的技术路线与李飞飞和LeCun有什么本质区别?
陈博远:做世界模型,最核心的问题是:模型学到的到底是相关性,还是因果?
举个例子。比如我们给模型看一段杯子落在桌上的视频,它完全可以推断出"桌子有引力把杯子吸住了",这个假设在统计上说得通,能解释观测到的状态变化,但是是错的。真实的物理原因只有重力。你没办法光靠观察区分这两种解释,得让模型去干预:把杯子移开,发现它掉地上了,"桌子有引力"就被排除了。这在强化学习里叫Reward Hacking(奖励破解),也是我们认为世界模型必须引入主动干预的根本原因,通过行动验证因果,而不是从旁观中拟合相关性。
拿这个标准去看现有的几条路线。李飞飞老师那边是从3D重建进来的,追求极致的空间还原,工程上很扎实。但三维重建解决的是"世界长什么样",不是"世界怎么运转"。知道瓶盖扣在瓶子上,和理解瓶盖没拧紧水会洒出来,是两件事。LeCun的方向是在隐空间里学表征,方向我们觉得是对的,但它有一个工程上很难绕过去的问题:像素生成好不好,人眼能直接判断,Critic Model(评判模型)容易建;隐空间里学到的表征对不对,怎么评,这个问题到现在没有公认的解法,也是JEPA(联合嵌入预测架构)路线从理论走向工程化最难的地方。
如何在隐空间里真正学到物理因果,而不只是一个视觉上说得过去、物理上随时会失效的假设,是我们最想解决的问题。
创投家:你们说自己做的是"通用世界基座模型",怎么理解这个概念?
陈博远:可以类比大语言模型的发展路径。早期也有人做法律大模型、金融大模型,针对垂直场景去训练。但最后大家发现,真正有效的方式是先训一个通用基座,让它把语言的底层规律学透,然后在上面做微调和适配。垂直模型天花板很低,通用模型才有涌现的可能。
世界模型今天也在经历类似的分岔。我们选择先做通用基座,有两个核心判断。第一,物理规律本身就是跨场景共通的——重力、碰撞、流体、时空一致性,这些东西不会因为你换了个应用场景就失效。一个真正学透了这些底层规律的模型,天然就能迁移到具身智能、工业仿真这些不同场景,不需要为每个领域重新建一套认知。第二,恰恰是这些场景,对世界模型的精确性和物理正确性要求极高,比如严肃工业场景里容不得半点物理判断失误,机器人抓取也不允许力的估算出错。所以我们从一开始就把物理正确性作为最核心的指标,而不是先追求视觉上好看、再回头补物理。
我们选择先把底层的物理因果学透,做一个通用的基座,基座做好了,上面的应用场景自然能长出来。
创投家:你们是把物理定律写入模型吗?
陈博远:不完全是。物理规律其实是人类对世界做的一个压缩。拉马努金不需要公式,也能一眼看出答案。我们不是把物理规律显性地写进模型,而是通过物理上可验证的方法,让模型自然地涌现出对物理的理解。
就像大模型的进化路径——大模型能有今天这么强的数学和编程能力,其实靠的也是强化学习——RLVR(基于可验证奖励的强化学习),用明确的、可验证的奖励信号,让模型在自我演进中涌现出对底层规律的理解。对物理世界也一样,我们可以做一些物理一致性的奖励,激活模型学习过程中的物理规律。
创投家:视频生成模型也在强调物理理解,这会是捷径吗?
陈博远:视频生成模型能生成流畅的动画,但可能出现穿模、不符合物理规律的现象——翻书时凭空出现第三只手。达到了“好看”,但不是“物理正确”。当然我们不是说基于开源视频模型做强化学习完全不行。
我们只是认为世界模型一定会经历从架构到数据的整套算法的改变。优先关注物理正确性,才符合Physical AI(物理人工智能)的需求。我们内部已经看到了一些Scaling Law(规模定律)的迹象,所以我们一直说,我们是一家关注通用世界基座模型的公司,不是只做面向具身或游戏的公司。
创投家:要实现物理定律理解的涌现,最大难点在哪?
陈博远:这是全方位的问题。数据上,第一人称视角数据很关键,因为它代表了主体和世界的交互,游戏引擎里的数据也很重要。人类学物理也不是直接学微积分,是从1+1=2开始的,学物理规律也有“课程学习”的概念。
架构上,记忆性问题、长时序问题,现在大家都解决不了。这些都是方兴未艾的问题,无论初创还是大厂都在探索。正是这样的土壤,给了我们机会。
创投家:逆矩阵的组织形式很特别,更像一个实验室?
陈博远:世界模型今天面对的核心问题还不是工程问题,是科学问题:怎么让模型真正学到物理因果。这件事没有现成的技术栈可以复用,需要的是对底层问题的深度思考和快速试错,是研究导向的组织最擅长的事情。
因此我们确实不太像一家传统意义上的公司,更像早期的DeepMind或者OpenAI刚成立的时候,一帮人聚在一起,就是想把一个技术问题搞明白。我们没有KPI,没有部门划分,甚至没有明确分工,只有分工偏好。内部叫这个文化"NO WALLS(没有部门墙)"。
为什么这么做?因为我们观察到,真正的创新往往就是两三个人做出核心突破,然后再倾注资源去放大。你提前画好部门和KPI,反而会把这种可能性堵死。
团队现在20到30人,一半是年轻的研究者,一半是从大厂出来的工程人才。我们很重视Infra(基础设施)这一块,好的算法一定是建立在好的基建和数据上的。
还有一点,我们是一个真正的AI native(AI原生)团队,这对我们来说不是一个口号,而是日常工作方式。新人入职第一件事,就是教他用好AI工具。我们内部测算过,每个人配合自己的agent(智能体),处理大量基础工程任务的效率是以前的好几倍,某种程度上一个人可以干原来一支小团队的活儿。这也是我们三十个人觉得够用的原因,这批高密度的人,每个人又能最大化地发挥AI的乘数效应,三十个AI原生的人,实际的战斗力能当几百人用。
当然核心的洞察和判断,代码风格的把控、工程架构的设计,这些还是得靠人来把关,AI替代不了。
外部叫我们"NEO Lab(新生代实验室)",我们自己也觉得还挺贴切的。团队里每个人都是带着好奇心来的,做自己觉得有价值的事。我们珍视每一个人,每个人都很重要。
创投家:这种纯研发导向的周期,会受到资本挑战吗?
陈博远:其实我们的速度比自己预期的快很多了,内部看到了一些Scale up(规模化提升)的迹象。我们认为半年到一年内能产生一些有意思的成果。投资人对我们的长期主义十分理解和支持。
我们现在解决的是底层的科学问题——世界模型怎么真正学到物理因果,这件事目前全世界没有人做出来。但历史反复证明,一旦核心科学问题被突破,后面的工程化和商业化反而是水到渠成的事。OpenAI花了好几年解决语言模型的Scaling Law(规模定律)问题,Anthropic花大量时间研究对齐和安全,当时外界也觉得太慢、太学术,但科学问题一旦解决,产品和商业价值是爆发式的。我们相信世界模型也是同样的逻辑。
创投家:上一轮融资主要花在哪?
陈博远:主要花在算力和数据上。基模训练、预训练、强化学习,都很吃算力。同时也在广纳贤才。
创投家:年初说四季度发布旗舰模型,进度如何?
陈博远:进度还不错,我们希望今年发布一个旗舰世界基座模型,真正关注物理正确性本身,给世界模型领域带来一些不一样的东西。
创投家:在你心中,逆矩阵的终极形态是怎样的?
陈博远:我在读Google的Deepmind创始人,Demis Hassabis自传时,有一段很有意思的对话——当别人问DeepMind想成为什么样的公司时,他说:“想成为获得最多诺贝尔奖的公司。”
整个世界模型还有很多问题需要解决,架构、算法、数据。我们之后会发布技术报告,把前期探索的东西展现给外界。核心关键就是把真正通用的世界基础模型带给大家,带给整个AI,让人工智能真正从数字世界走进物理世界,为具身智能、工业仿真、游戏这些产业提供底层的通用物理认知引擎。
创投家:再聊聊你的成长经历吧,你是怎么一步步走到今天这条路上的?
陈博远:我出生在山东的一个普通家庭,高考到北大元培学院。父母从小对我放养,所以我小时候经常自己泡书店,研究一些奇怪的东西。我特别喜欢动手,比如自己做小发电机什么的。
后来中学时代我开始对数学特别感兴趣,越级学习成为一种习惯。高中开始打数学竞赛,但很快感觉我更想做一些探索新规律的事情。数学本身就是AI的底层语言,我们现在可以看到,Hinton学的是心理学和数学,LeCun是信号处理出身,Ilya本科就是数学,其实从数学走向AI是一条很自然的路,而世界模型要做的事情,本质上也是用数理逻辑去逼近物理世界的规律。
创投家:什么时候对AI产生了兴趣?
陈博远:2021年,高二的时候,偶然听到北大的一位学长在线上介绍人工智能这个专业。当时AI还没现在这么火,没有大模型的概念。但我记得很清楚,当时脑子里闪过一个想法——这就是我想做的事情,我就是为这个学科而生的。
我一直觉得数学研究必须要有一个能落地、产生社会变革意义的方向,现在看起来,那就是AGI(通用人工智能)。到了高三,我的书桌上有一个小纸条,写着三个词:北京大学、元培学院、人工智能。
创投家:应该有很多选择吧?为什么选择北大元培?
陈博远:高考结束后,清华招办也联系过我。但我还是比较坚定想去北大元培。元培对我来说意味着自由的土壤。北大强调“思想自由,兼容并包”,元培的院训是“尚自然展个性,化孤独为共同”。人工智能本身就是跨学科的结合,这里给我更大的空间。
创投家:大一就开始发顶会论文,当时是什么想法?
陈博远:我在大一寒假确定做强化学习,去听了杨耀东老师一门大三的《多智能体系统》,杨老师惊讶课堂里来了个大一的学生,我们聊得很投机,后来就加入了课题组。也是在那时候认识了嘉铭。至于发顶会论文、北大年度人物,对我来说都算是比较幸运的事情。我更多还是一个兴趣驱动、热情驱动的人,这些头衔对我是一种意外之喜,但不是出发的目的。
创投家:为什么本科毕业就选择创业,而不是读博或者去大厂?
陈博远:之前也有一些不错的去处,DeepSeek、Google的研究团队都联系过我,我们几位联创都能在大厂拿到很好的offer。但大家核心还是想自己组建一个组织,做底层创新。
我们算过一个数:从第一次工业革命到现在,技术革新间隔从100年变成50年、25年。2025到2035年是AI原始创新的关键窗口,这个窗口会慢慢闭合。既然当下有想做的事和志同道合的团队,为什么不现在就出来?
创投家:作为北大走出来的AI新生代,北大这个背景对你们意味着什么?
陈博远:北大给我们最大的东西不是光环,是土壤。元培学院的院训是"尚自然展个性,化孤独为共同",这种氛围让我大一就可以跑去听大三的课,再到和大家一同凝聚一个团队做前沿的探索。如果是一个按部就班的培养体系,这件事不会发生。
团队里有很多北大的人,但不只是北大。我们的工程团队来自各个大厂,也有浙大、中科大的同学。北大给我们的不是一个封闭的圈子,而是一种做事的方式——鼓励你去碰最难的问题,允许你走一条没人走过的路。我们第一轮融资的投资方之一就是北大校友基金燕缘创投,学校和校友体系在背后给了我们很实在的支持。






快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论