22岁的北大青年学者，想做真正理解物理的通用世界基座模型

资本与产业界正迅速达成共识：AI正在从虚拟世界迈向物理世界，而世界模型这套让机器真正理解物理规律、预测状态转移的底层认知引擎，是这条路上最关键的一块拼图。

据 Morgan Stanley 于 2025 年 4 月发布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》报告预测，世界模型所对应的下游产业——从具身智能到自动驾驶到工业仿真——全球总市场规模将在 2050 年达到 5 万亿美元量级。

当整个行业还在争论世界模型该怎么做的时候，一支从北大走出来的年轻团队——逆矩阵科技，带着对于世界模型路线独特的思考，走进了我们的视野。

”做世界模型，最核心的问题是：模型学到的到底是相关性，还是因果？”

“如何在隐空间里真正学到物理因果，而不只是一个视觉上说得过去、物理上随时会失效的假设，是我们最想解决的问题。”

“世界模型必须引入主动干预，通过行动验证因果，而不是从旁观中拟合相关性。”

“我们不是把物理规律显性地写进模型，而是通过物理上可验证的方法，让模型自然地涌现出对物理的理解。”

……

这些观点正来自于逆矩阵科技的联合创始人——陈博远，而他的另一个身份则是北大元培学院22岁的应届毕业生。

陈博远在大一时就中稿了AI三大顶会之一的NeurIPS，本科生在此发文本就极为罕见。此后几年，他又陆续拿下NeurIPS Oral（口头报告，全球录取率不足0.5%）和ACL最佳论文（全球仅4篇，国内学术机构首篇独立完成）。毕业前，他已是北大学生年度人物和北大五四奖章得主，这是北京大学给予学生的两项最高荣誉。

他与同出北大的师兄吉嘉铭一起创立了逆矩阵科技，做通用世界基座模型。吉嘉铭同样是2025北大学生年度人物，也是极少数同时获得苹果、腾讯、蚂蚁三家顶级科技企业认可的青年研究者——2025年Apple Scholar（苹果学者，全球遴选，中国大陆仅2位）、首届腾讯青云奖学金、蚂蚁Intech奖学金（全球共10名）。

2026年3月，公司完成超千万美元天使轮融资，由高瓴创投和北大系基金燕缘创投联合投资。近期获悉，他们又将完成新一轮融资。

近日，我们与陈博远围绕世界模型和他的成长经历进行了一次深入的对谈。

▎以下为与陈博远的对话全文，略有删减：

创投家：世界模型现在非常火，从逆矩阵的角度是怎么理解这件事的？

陈博远：现在世界模型很火，可以说Anything is world model（一切皆世界模型）。但其实世界模型这个概念最早就是从强化学习和控制理论里来的。

1990年图灵奖得主、强化学习之父 Richard Sutton 提出 Dyna 架构，指出模型需要预测环境如何响应智能体的行动，再到后来2018年 David Ha 和 Schmidhuber 发表了一篇名为 World Models 的文章，指出智能体使用世界模型学习策略，并且在自己产生的梦世界中利用交互学习世界模型。

回到第一性原理。AI一定会从虚拟世界走向物理世界，而在物理世界里，核心是Interaction——交互。人类是怎么理解世界的？端起一个水杯大概三步：理解世界——什么是水杯，什么是桌面；编码到脑子里——隐空间；执行策略——不断尝试，失败了更新自己的信念。所以我们最终需要的世界模型，其实是一个状态转移模型——基于当下状态采取什么action（动作），触发什么next state（下一状态）。这个东西，强化学习研究了几十年。

创投家：你们的技术路线与李飞飞和LeCun有什么本质区别？

陈博远：做世界模型，最核心的问题是：模型学到的到底是相关性，还是因果？

举个例子。比如我们给模型看一段杯子落在桌上的视频，它完全可以推断出"桌子有引力把杯子吸住了"，这个假设在统计上说得通，能解释观测到的状态变化，但是是错的。真实的物理原因只有重力。你没办法光靠观察区分这两种解释，得让模型去干预：把杯子移开，发现它掉地上了，"桌子有引力"就被排除了。这在强化学习里叫Reward Hacking（奖励破解），也是我们认为世界模型必须引入主动干预的根本原因，通过行动验证因果，而不是从旁观中拟合相关性。

拿这个标准去看现有的几条路线。李飞飞老师那边是从3D重建进来的，追求极致的空间还原，工程上很扎实。但三维重建解决的是"世界长什么样"，不是"世界怎么运转"。知道瓶盖扣在瓶子上，和理解瓶盖没拧紧水会洒出来，是两件事。LeCun的方向是在隐空间里学表征，方向我们觉得是对的，但它有一个工程上很难绕过去的问题：像素生成好不好，人眼能直接判断，Critic Model（评判模型）容易建；隐空间里学到的表征对不对，怎么评，这个问题到现在没有公认的解法，也是JEPA（联合嵌入预测架构）路线从理论走向工程化最难的地方。

如何在隐空间里真正学到物理因果，而不只是一个视觉上说得过去、物理上随时会失效的假设，是我们最想解决的问题。

创投家：你们说自己做的是"通用世界基座模型"，怎么理解这个概念？

陈博远：可以类比大语言模型的发展路径。早期也有人做法律大模型、金融大模型，针对垂直场景去训练。但最后大家发现，真正有效的方式是先训一个通用基座，让它把语言的底层规律学透，然后在上面做微调和适配。垂直模型天花板很低，通用模型才有涌现的可能。

世界模型今天也在经历类似的分岔。我们选择先做通用基座，有两个核心判断。第一，物理规律本身就是跨场景共通的——重力、碰撞、流体、时空一致性，这些东西不会因为你换了个应用场景就失效。一个真正学透了这些底层规律的模型，天然就能迁移到具身智能、工业仿真这些不同场景，不需要为每个领域重新建一套认知。第二，恰恰是这些场景，对世界模型的精确性和物理正确性要求极高，比如严肃工业场景里容不得半点物理判断失误，机器人抓取也不允许力的估算出错。所以我们从一开始就把物理正确性作为最核心的指标，而不是先追求视觉上好看、再回头补物理。

我们选择先把底层的物理因果学透，做一个通用的基座，基座做好了，上面的应用场景自然能长出来。

创投家：你们是把物理定律写入模型吗？

陈博远：不完全是。物理规律其实是人类对世界做的一个压缩。拉马努金不需要公式，也能一眼看出答案。我们不是把物理规律显性地写进模型，而是通过物理上可验证的方法，让模型自然地涌现出对物理的理解。

就像大模型的进化路径——大模型能有今天这么强的数学和编程能力，其实靠的也是强化学习——RLVR（基于可验证奖励的强化学习），用明确的、可验证的奖励信号，让模型在自我演进中涌现出对底层规律的理解。对物理世界也一样，我们可以做一些物理一致性的奖励，激活模型学习过程中的物理规律。

创投家：视频生成模型也在强调物理理解，这会是捷径吗？

陈博远：视频生成模型能生成流畅的动画，但可能出现穿模、不符合物理规律的现象——翻书时凭空出现第三只手。达到了“好看”，但不是“物理正确”。当然我们不是说基于开源视频模型做强化学习完全不行。

我们只是认为世界模型一定会经历从架构到数据的整套算法的改变。优先关注物理正确性，才符合Physical AI（物理人工智能）的需求。我们内部已经看到了一些Scaling Law（规模定律）的迹象，所以我们一直说，我们是一家关注通用世界基座模型的公司，不是只做面向具身或游戏的公司。

创投家：要实现物理定律理解的涌现，最大难点在哪？

陈博远：这是全方位的问题。数据上，第一人称视角数据很关键，因为它代表了主体和世界的交互，游戏引擎里的数据也很重要。人类学物理也不是直接学微积分，是从1+1=2开始的，学物理规律也有“课程学习”的概念。

架构上，记忆性问题、长时序问题，现在大家都解决不了。这些都是方兴未艾的问题，无论初创还是大厂都在探索。正是这样的土壤，给了我们机会。

创投家：逆矩阵的组织形式很特别，更像一个实验室？

陈博远：世界模型今天面对的核心问题还不是工程问题，是科学问题：怎么让模型真正学到物理因果。这件事没有现成的技术栈可以复用，需要的是对底层问题的深度思考和快速试错，是研究导向的组织最擅长的事情。

因此我们确实不太像一家传统意义上的公司，更像早期的DeepMind或者OpenAI刚成立的时候，一帮人聚在一起，就是想把一个技术问题搞明白。我们没有KPI，没有部门划分，甚至没有明确分工，只有分工偏好。内部叫这个文化"NO WALLS（没有部门墙）"。

为什么这么做？因为我们观察到，真正的创新往往就是两三个人做出核心突破，然后再倾注资源去放大。你提前画好部门和KPI，反而会把这种可能性堵死。

团队现在20到30人，一半是年轻的研究者，一半是从大厂出来的工程人才。我们很重视Infra（基础设施）这一块，好的算法一定是建立在好的基建和数据上的。

还有一点，我们是一个真正的AI native（AI原生）团队，这对我们来说不是一个口号，而是日常工作方式。新人入职第一件事，就是教他用好AI工具。我们内部测算过，每个人配合自己的agent（智能体），处理大量基础工程任务的效率是以前的好几倍，某种程度上一个人可以干原来一支小团队的活儿。这也是我们三十个人觉得够用的原因，这批高密度的人，每个人又能最大化地发挥AI的乘数效应，三十个AI原生的人，实际的战斗力能当几百人用。

当然核心的洞察和判断，代码风格的把控、工程架构的设计，这些还是得靠人来把关，AI替代不了。

外部叫我们"NEO Lab（新生代实验室）"，我们自己也觉得还挺贴切的。团队里每个人都是带着好奇心来的，做自己觉得有价值的事。我们珍视每一个人，每个人都很重要。

创投家：这种纯研发导向的周期，会受到资本挑战吗？

陈博远：其实我们的速度比自己预期的快很多了，内部看到了一些Scale up（规模化提升）的迹象。我们认为半年到一年内能产生一些有意思的成果。投资人对我们的长期主义十分理解和支持。

我们现在解决的是底层的科学问题——世界模型怎么真正学到物理因果，这件事目前全世界没有人做出来。但历史反复证明，一旦核心科学问题被突破，后面的工程化和商业化反而是水到渠成的事。OpenAI花了好几年解决语言模型的Scaling Law（规模定律）问题，Anthropic花大量时间研究对齐和安全，当时外界也觉得太慢、太学术，但科学问题一旦解决，产品和商业价值是爆发式的。我们相信世界模型也是同样的逻辑。

创投家：上一轮融资主要花在哪？

陈博远：主要花在算力和数据上。基模训练、预训练、强化学习，都很吃算力。同时也在广纳贤才。

创投家：年初说四季度发布旗舰模型，进度如何？

陈博远：进度还不错，我们希望今年发布一个旗舰世界基座模型，真正关注物理正确性本身，给世界模型领域带来一些不一样的东西。

创投家：在你心中，逆矩阵的终极形态是怎样的？

陈博远：我在读Google的Deepmind创始人，Demis Hassabis自传时，有一段很有意思的对话——当别人问DeepMind想成为什么样的公司时，他说：“想成为获得最多诺贝尔奖的公司。”

整个世界模型还有很多问题需要解决，架构、算法、数据。我们之后会发布技术报告，把前期探索的东西展现给外界。核心关键就是把真正通用的世界基础模型带给大家，带给整个AI，让人工智能真正从数字世界走进物理世界，为具身智能、工业仿真、游戏这些产业提供底层的通用物理认知引擎。

创投家：再聊聊你的成长经历吧，你是怎么一步步走到今天这条路上的？

陈博远：我出生在山东的一个普通家庭，高考到北大元培学院。父母从小对我放养，所以我小时候经常自己泡书店，研究一些奇怪的东西。我特别喜欢动手，比如自己做小发电机什么的。

后来中学时代我开始对数学特别感兴趣，越级学习成为一种习惯。高中开始打数学竞赛，但很快感觉我更想做一些探索新规律的事情。数学本身就是AI的底层语言，我们现在可以看到，Hinton学的是心理学和数学，LeCun是信号处理出身，Ilya本科就是数学，其实从数学走向AI是一条很自然的路，而世界模型要做的事情，本质上也是用数理逻辑去逼近物理世界的规律。

创投家：什么时候对AI产生了兴趣？

陈博远：2021年，高二的时候，偶然听到北大的一位学长在线上介绍人工智能这个专业。当时AI还没现在这么火，没有大模型的概念。但我记得很清楚，当时脑子里闪过一个想法——这就是我想做的事情，我就是为这个学科而生的。

我一直觉得数学研究必须要有一个能落地、产生社会变革意义的方向，现在看起来，那就是AGI（通用人工智能）。到了高三，我的书桌上有一个小纸条，写着三个词：北京大学、元培学院、人工智能。

创投家：应该有很多选择吧？为什么选择北大元培？

陈博远：高考结束后，清华招办也联系过我。但我还是比较坚定想去北大元培。元培对我来说意味着自由的土壤。北大强调“思想自由，兼容并包”，元培的院训是“尚自然展个性，化孤独为共同”。人工智能本身就是跨学科的结合，这里给我更大的空间。

创投家：大一就开始发顶会论文，当时是什么想法？

陈博远：我在大一寒假确定做强化学习，去听了杨耀东老师一门大三的《多智能体系统》，杨老师惊讶课堂里来了个大一的学生，我们聊得很投机，后来就加入了课题组。也是在那时候认识了嘉铭。至于发顶会论文、北大年度人物，对我来说都算是比较幸运的事情。我更多还是一个兴趣驱动、热情驱动的人，这些头衔对我是一种意外之喜，但不是出发的目的。

创投家：为什么本科毕业就选择创业，而不是读博或者去大厂？

陈博远：之前也有一些不错的去处，DeepSeek、Google的研究团队都联系过我，我们几位联创都能在大厂拿到很好的offer。但大家核心还是想自己组建一个组织，做底层创新。

我们算过一个数：从第一次工业革命到现在，技术革新间隔从100年变成50年、25年。2025到2035年是AI原始创新的关键窗口，这个窗口会慢慢闭合。既然当下有想做的事和志同道合的团队，为什么不现在就出来？

创投家：作为北大走出来的AI新生代，北大这个背景对你们意味着什么？

陈博远：北大给我们最大的东西不是光环，是土壤。元培学院的院训是"尚自然展个性，化孤独为共同"，这种氛围让我大一就可以跑去听大三的课，再到和大家一同凝聚一个团队做前沿的探索。如果是一个按部就班的培养体系，这件事不会发生。

团队里有很多北大的人，但不只是北大。我们的工程团队来自各个大厂，也有浙大、中科大的同学。北大给我们的不是一个封闭的圈子，而是一种做事的方式——鼓励你去碰最难的问题，允许你走一条没人走过的路。我们第一轮融资的投资方之一就是北大校友基金燕缘创投，学校和校友体系在背后给了我们很实在的支持。

22岁的北大青年学者，想做真正理解物理的通用世界基座模型｜AI Founder 请回答

敬原创，有钛度，得赞赏