获1600万美元种子融资,Mimic打造让机器人“精细操作”的具身基础模型

AGI
具身智能机器人走向普及,需要产业链上所有环节的共同进步

文 | 阿尔法公社

具身智能通用模型是目前具身智能行业最重要的探索方向之一。

与大多数人的直觉相反,让机器人理解人的意图(语言和视觉理解)是相对容易的,让机器人完成对灵巧性要求很高的“精细操作”却更难。

一家由ETH Zürich(苏黎世联邦理工学院)Soft Robotics Lab分拆的具身智能公司,专注在通用机器人的灵巧性问题上探索,要打造通用机器人操作的可扩展AI模型。它们的差异化在于,不试图制造完整的机器人,而是专注于手部的操作。通过这条路径的探索让机器人能够精通“精细操作”,完成从垃圾回收到机床上下料的实际工作。

来源:Mimic Robotics

这家公司叫Mimic Robotics,它近日获得由Elaia和Speedinvest领投的1600万美元种子轮融资,Founderful、1st Kind、10X Founders、2100以及Sequoia Scout跟投。在2024年5月,它还获得Founderful领投的250万美元早期融资。

从手部切入,打造让机器人精细操作的具身基础模型

Mimic Robotics成立于2024年,从ETH Zürich(苏黎世联邦理工学院)Soft Robotics Lab分拆而来,实验室的核心成员Stefan Weirich(CEO)、Elvis Nava(CTO)、Stephan-Daniel Gravert(CPO)、Benedek Forrai (首席科学家)担任公司的联合创始人,实验室负责人Robert Katzschmann教授是公司的联合创始人兼首席顾问。

Mimic Robotics的创始团队,来源:Mimic Robotics

在通用具身模型出现之前,机器人的大部分领域被特设(ad-hoc)的方法所主导,这些方法是针对特定任务的,它们有足够高的精度和不错的鲁棒性,但是只能解决单一任务。例如,它们需要多个独立的组件来解决路径规划、碰撞避免、物体检测、状态估计和应用逻辑等问题。很显然,它们不具有通用性。同时,让整个系统具有高可靠性和商业可行性,也相对困难。

例如,传统的机器人手,是专为特定的重复性任务而设计,缺乏灵活性。其编程过程耗时且需要专业知识,导致它们难以适应需要机器人配合人类专用工具和工作流程的动态环境。

Mimic Robotics团队,押注于具身智能在行为上的端到端深度学习模型(也可称为大行为模型),相比由多个独立组件组成的复杂系统,它可以理解为一个将RGB图像和本体感觉读数映射到机器人动作的单一端到端模型。这使得学习大量不同的操作任务变成了一个数据扩展问题,而不是一系列特设的工程问题。

但是从计算规模和数据的质和量来说,通用具身智能模型的发展水平,相比大语言模型,还要落后5年左右,当然,这也给了初创公司在基础模型层面进行竞争的机会。

当然,现在通用具身智能模型公司的估值水平都已经不低,例如Figure,估值已经390亿美元,其他如Skild AIPhysical Intelligence也估值数十亿美元。

Mimic Robotics专注在机器人的“操作”(manipulation)能力,因为无论其余的机器人系统是什么样子(无论是固定工作站、轮式机器人、四足机器人还是人形机器人),“操作”都是实现机器人广泛经济影响的关键。

具体来说:Mimic Robotics构建能无缝融入人类工作场所的灵巧机械手,并用端到端的基础AI模型来驱动它们,使得这些机械手能够执行通用的技能,简单的工业和物流拾取放置,到配套、食品制备,甚至是服务和护理。

人工遥操和第一人称人类视频数据结合的数据训练策略

通用具身智能模型,其原生数据格式是“机器人遥操作数据”,以往的数据获取方式是部署大量机器人,雇佣机器人操作员,并获取大量的机器人轨迹和摄像头画面数据,以便通过模仿学习来训练模型。

但是通用模型,其模型能力的好坏,大半倒要决定于数据的数量和质量,此前的数据获取方式,保证了数据质量,但鉴于通用具身智能模型的Scaling Law已经一定程度上被验证(参看我们此前关于Generalist的文章),模型对于数据量的需求几乎是无限的,若长期依赖昂贵的物理机器人人工数据收集,成本很难控制,必然遇到瓶颈。

Mimic Robotics采取的方法是让工厂工人戴上能够捕捉他们执行日常任务时详尽数据的手套,这些数据随后被用于训练具身智能模型,确保Mimic的机械手能够复现人类的操作手法,包括对工作环境的变化做出反应。同时,它们用现在可以低成本获取的海量第一人称人类视频数据上进行训练。保证了数据的数量,同时控制了成本。

前文提到,Mimic Robotics构建能无缝融入人类工作场所的灵巧机械手,一方面因为人类的手和机器人手之间的“具身差距”(embodiment gap)远小于人类手和双指夹具机器人之间的差距,另一方面,也因为对于它们专注的机器人的“操作”能力来说,灵巧机械手是最佳载体。

不过Mimic Robotics并没有一开始就走人形机器人的路线,甚至没有自己生产机器人的手臂;他们是市面上已广泛销售的机械臂,并制造自己的机械手与之连接。

这样做的好处首先在于降低了他们的开发和生产的成本,另一方面,使用市售的机械臂可以让他们无缝接入到这些机械臂原来就有的场景里,并且做得更好。

Mimic联合创始人Elvis Nava(CTO)表示:“用市售机械臂加我们的机械手结合,可以更快的切入市场,解决行业目前急需解决的问题,即完成那些原来需要人类完成的工作,而且即插即用。我们已经完成了一个主要技术里程碑,就是从实验室验证技术,转变为构建能够大规模执行客户任务的产品化机械手。”

凭借其解决方案,mimic旨在服务零售、物流和制造业中固定工位的体力劳动市场,这些行业在欧洲面临严重的劳动力短缺,且许多任务对工人来说枯燥重复。

根据Grand View Research最近的研究,2024年全球工业机器人市场规模为339亿美元,并预测其年增长率将接近10%,到2030年将达到605亿美元。

目前,Mimic正与欧洲大型制造和汽车公司合作开展多个试点项目,在装配线和包装环节测试其技术,其机械臂+机械手的全面商业部署将在未来一到两年内开始。

进入全面商业部署后,Elvis Nava表示,Mimic将采取两种定价模式。主流的是提供“机器人即服务”订阅,这降低了采用门槛,并能让客户从第一个月起就看到运营成本的节省。

他还补充说,达到一定规模的一些客户不喜欢运营支出模式,因此Mimic也会将机器人工作站直接出售给他们,并收取持续的服务等级协议(SLA)费用和软件订阅费。

具身智能机器人走向普及,需要产业链上所有环节的共同进步

具身智能机器人要走向实用化,走向普及,目前还面临众多卡点。在硬件方面,就有感知(视觉,听觉,触觉),移动能力(双足、四足、轮式),操作能力(手臂,灵巧手),续航能力,以及成本控制;在软件/智能方面,有指令理解能力,对物理规则的遵循,控制算法,通用泛化能力与鲁棒性的平衡,当然,还有作为基石的数据。

要让具身智能机器人走向普及,需要的是产业链上所有环节的共同进步,无论是软件还是硬件,无论是模型还是机械手。

但这需要一个过程,就像新能源智能汽车的产业链,经过了多年的共同发展,在能源(纯电、插电、增程)、车体、车内舒适性、智能化上都有长足进步,才迎来了近几年的整体爆发。  

当然,对于具身智能行业,通用智能(模型)的进化是核心,但是推动具身通用智能的进化,并不像LLM那样容易,因为作为物理AI的通用智能,它的维度要更加复杂,所以整个具身智能机器人各个部位的整体突破才显得更重要,因为单个部位的突破,比如机械手-操作能力,只要它进入应用,创造价值,积累数据,也是能够反复通用智能的。

中国市场拥有全球最完备的具身智能硬件产业链之一,在成本控制上更是全球领先,同时也拥有丰富的应用落地场景,中国在具身智能产业链上各个领域的创业者们,都有机会做到世界前列。

本文系作者 阿尔法公社 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App