国家队出手,通用人形机器人打响第一枪 | 钛媒体焦点

人形机器人,每日一变。

1

人形机器人距离下场干活,又往前迈进了一步。

3月12日,北京人形机器人创新中心对外发布了首个“一脑多能”、“一脑多机”的通用具身智能平台“慧思开物”。通过该平台,这家公司试图将人形机器人的通用化能力拆解成单个的技能模块,通过组合这些技能模块,让通用人形机器人的开发门槛大幅降低,并且还能让不同形态的机器人也能适配这些能力。

“具身智能在‘智能化’方面仍处于初级阶段,行业亟需一个具备多本体兼容性、多场景适应性和强大泛化能力的通用智能平台。为了替具身智能产业补上通用软件系统这块重要拼图,创新中心研发了全球首个支持多本体多场景应用的通用具身智能平台‘慧思开物’。”

创新中心总经理熊友军表示,在“慧思开物”的支持下,优必选在全球范围内首次把群脑网络(BrainNet)用于人形机器人执行整条产线的工业级任务。

AI大模型+元技能库,组建“大脑”与“小脑”

具体而言,“慧思开物”由AI大模型驱动的任务规划“大脑”以及数据驱动的端到端技能执行具身“小脑”构成。

其中,“大脑”具备自然交互、空间感知、意图理解、分层规划和错误反思等能力,“小脑”分为具身操作和具身运控两个子平台:具身操作涵盖元技能库、泛化抓取、技能拆解和错误处理等功能,而具身运控负责实现全身控制、双臂协作、稳定行走和移动导航等任务。

由具身“大脑”进行任务规划,再调用具身“小脑”技能库执行具体动作,并将执行反馈传递给具身“大脑”,形成任务闭环。

基于高效协同的具身“大脑”与具身“小脑”架构,“慧思开物”可以精准解析自然语言交互指令,通过多模态信息融合与上下文理解,将复杂任务分解为可执行的子任务序列,并在任务执行过程中实时监测状态,通过自适应纠错机制和动态路径规划,确保任务的高效推进与准确完成。

同时,“慧思开物”内置多场景适配引擎,支持从工业制造到家庭服务等多种场景,结合高效的资源调度与并行计算能力,能够精准满足特定场景下的工作节拍与精度标准,为机器人在复杂场景的应用提供可靠的技术保障。

“现在慧思开物的技能库中已经具备了30多种技能,可以覆盖大部分的任务类型。”创新中心CTO唐剑表示,整个端侧运动控制的输出功率为200赫兹,可以让机器人的整个运动非常平滑。

而在人形机器人的数据训练方面,目前业界主流的训练方式有两种。其一,是让机器人在仿真环境中训练,然后将训练结果迁移到真实环境中;其二,则是让机器人直接在真实环境中训练,根据真实环境的训练过程进行AI的直接调教。

宇树科技创始人曾向钛媒体表示,随着端到端的AI模型进一步完善,仿真数据对于人形机器人将不再重要。而在与创新中心的交流中,唐剑则向钛媒体表示,他们更倾向于虚实结合的数据训练方式。

2

“我们一贯坚持虚实结合的训练,才能达到最好的效果。”唐剑称,在虚拟环境中能够非常好地去泛化和随机化场景,比如改变环境光线、物体形状、颜色等。而在实际场景中,这些多样性并不容易实现。

根据创新中心提供的数据,当混合数据比例达到真机数据:仿真数据为100:400时,机器人的执行成功率接近100%。

距离“下场干活”,越来越近

基于虚实结合的训练模式和以技能库为核心的运动执行方式,“慧思开物”此次也展示了工业分拣、积木搭建、桌面清理和物流打包四个场景的真机操作。通过语音交互、APP直连等多种方式,用户能够与机器人自然交互,并通过模糊指令让机器人完成操作任务。

在工业分拣任务中,通过“慧思开物”APP直连,UR-5e机械臂能够精准解析语音指令,将复杂的技术能力(如推理、规划、技能调用)封装为简单易用的操作流程,并通过双臂协同的方式完成分拣操作,显著降低了用户使用门槛。

同时,平台支持自定义模型和技能的快速添加,能够灵活适配不同场景的应用需求,为工业自动化领域提供便捷、高效的解决方案。

在积木搭建中,“慧思开物”通过大模型思维链能力,首次实现了复杂任务的智能化拆解与执行。基于随机搭建的积木样例,“天工”利用视觉大模型(VLM)对样例进行拆解,精确规划每一层的搭建顺序,准确拾取相应积木,并按次序完成了3层积木的毫米级精准搭建。

1

在桌面清理场景中,人形机器人“天工”展现了双臂协作的高效性与动态环境下的自适应能力,流畅地整理桌面餐具,将垃圾收进锡纸盘并放入垃圾桶。整个过程中,机器人在多次任意随机的人为打断和移位干扰的情况下,仍能自主纠错、重新规划并完成任务。

在物流打包场景,基于“慧思开物”平台,“天工PRO”首次实现了全尺寸人形机器人物流打包全流程的自主作业。

通过上半身29个自由度的配合,“天工PRO”使用左右手分别拿起物品和扫码枪,通过头部相机确认物品条形码位置,双手协同完成扫码、装箱、封箱及粘贴快递标签等一系列操作。

“目前,创新中心正在将这些能力逐步实现商业化落地。”唐剑称,现在主要探索的方向为教育科研、健康养老、特种作业以及工业制造。(本文首发于钛媒体APP,作者 | 饶翔宇  编辑 | 钟毅)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 平台由“大脑”和“小脑”构成,分工明确,感觉能处理超复杂任务!

    回复 3月14日 · via pc
  • 数据驱动的具身“小脑”,是不是意味着机器人能更灵活应对情况?

    回复 3月14日 · via pc
  • 感觉这平台能让机器人走进更多普通人的生活,太期待了!

    回复 3月14日 · via android
  • 桌面清理场景展示,体现了平台在日常应用方面的实用性!

    回复 3月14日 · via android
  • 这具身智能平台听起来超厉害,把复杂技能拆分,开发难度降了好多!

    回复 3月14日 · via iphone
  • 积木搭建场景展示出平台在精细操作方面的强大能力,太惊艳了!

    回复 3月14日 · via h5
  • 降低开发门槛这一点太赞,能让更多人投身机器人研发领域了!

    回复 3月14日 · via iphone
  • 特种作业用这机器人,能帮工作人员解决不少危险困难任务呢!

    回复 3月14日 · via h5
  • 把复杂任务拆成技能模块,开发人员能更有针对性地优化了!

    回复 3月14日 · via h5
  • 有了“慧思开物”,不同形态机器人适配更简单,应用场景要拓宽了!

    回复 3月14日 · via iphone
更多评论

快报

更多

19:42

商务部:探索在具备安全条件的地区开通低空物流航线、开发低空旅游项目,拓展低空消费场景

19:41

商务部:落实市内免税店政策,推动已批准设立的市内免税店尽快完成建设并营业

19:41

国务院办公厅转发商务部《关于支持国际消费中心城市培育建设的若干措施》的通知

19:37

丽珠集团:拟向控股子公司丽珠生物增资10亿元

19:34

恒邦股份:2024年净利润同比增长4.07% 拟10派1.41元

19:32

中国银行:熊猫债承销、中资离岸债承销、跨境托管、境外托管等业务市场份额稳居中资同业第一

19:32

中国银行:深入推进“五篇大文章”,绿色金融保持领先

19:31

中国银行:截至去年末为10.29万家科技型企业提供1.91万亿元授信支持

19:26

我国短视频用户规模超10亿人,人均每天刷短视频156分钟

19:21

唐勇、党彦宝、李民吉被撤销全国政协委员资格

19:21

中盐化工:2024年净利润同比下降56.32% 拟10派1.234元

19:20

中远海能:2024年净利润同比增长19.37%,拟10派2.1元

19:11

纳芯微:拟筹划发行H股股票并在香港联交所上市

19:08

香港证券业2024年净盈利总额同比增长56%至444亿港元

19:08

3月26日美股盘前要闻

18:58

广州地铁十号线(西塱至广州大道中)将在年内建成通车

18:56

云赛智联:2024年净利润2.02亿元,同比增长4.92%

18:56

高伟达:2024年净利润3135.7万元,同比增长9.21%

18:49

WTI原油期货日内涨幅达1.00%,现报69.69美元/桶

18:48

中国银行:2024年末集团总资产突破35万亿,营收、利润双增长

25

扫描下载App