文 | 金角财经,作者 | Chester
机器人开始进家门了。
最近一年,人形机器人最热闹的故事,大多发生在工厂里。
搬箱子、拧螺丝、分拣货物、上下料……几乎所有头部机器人公司都在争夺制造业场景,希望率先实现规模化落地。
原因并不复杂。相比家庭,工厂拥有更标准的流程、更固定的工位和更明确的工作目标,是现阶段机器人最容易创造价值的地方。
但就在行业集体涌向工厂的时候,获得字节跳动、美团、阿里巴巴、小米等资本支持的自变量,却把目光投向了另一个方向:家庭。
今年以来,自变量频繁展示机器人在家庭场景中的能力。与58到家合作推出机器人保洁服务,让机器人跟随保洁人员进入真实家庭;发布会上,机器人自主整理杂物、捡起随机丢弃纸团的视频,也在社交媒体上广泛传播。
这多少有些反常识。因为家庭恰恰是机器人行业公认最复杂、最难落地的场景之一。从实际体验来看,今天的人形机器人距离“机器人保姆”还有相当长的路要走。
有体验者发现,机器人收拾书桌时,一个简单动作往往要思考数分钟;整理鞋子时,甚至找不到鞋柜的位置。很多时候,保洁阿姨一分钟完成的工作,机器人可能需要折腾半小时。
既然如此,自变量为什么还要急着把机器人送进家庭?
最近,自变量开源的XRZero-GO项目,或许提供了一个新的观察视角。
这套方案不仅开放了覆盖3000多个任务的训练数据,还公布了一套大幅降低机器人数据采集成本的方法。消息公布后,很快引发行业关注。
原因在于,它触碰到了当下具身智能行业最现实的瓶颈之一——数据。
对于今天的人形机器人来说,家庭不仅意味着未来潜在的商业市场,也意味着真实世界中最丰富、最复杂、最难复制的数据来源。
如果把机器人保洁和XRZero-GO放在一起看,自变量正在做的,或许是一件事的两个侧面:一边降低获取数据的成本,一边寻找更多真实数据的来源。
而我们越来越多的普通家庭,也正在成为下一代机器人的训练场。
自变量为什么盯上家务活?
最近,一段机器人上门做保洁的视频,在社交平台上引发不少讨论。
视频里,机器人跟着保洁阿姨一起进入家庭,负责整理桌面、归置物品、收纳鞋子。看上去,“机器人保姆”似乎离现实生活越来越近了。
这正是自变量与58到家合作推出的机器人保洁服务。
![]()
收费标准与普通家政服务接近,但上门的不只有保洁阿姨,还有机器人和机器人工程师。
很多人最关心的问题也很直接:机器人保洁,到底已经发展到什么程度了?
AI科技博主“葬爱咸鱼”体验过这项服务,但真实表现与很多人的想象存在不小落差。
机器人刚进门,就在玄关附近卡了10分钟。
开始整理书桌后,一个简单动作往往需要思考一两分钟。收拾鞋子时,它能够识别出鞋子,却判断不出鞋柜的位置,只能把鞋放在鞋柜下方。机械手刚拿完鞋子,又直接去叠枕巾,结果枕巾没拿稳掉到了地上,前面的清洁工作也白费了。
![]()
整个过程中,机器人承担的更多是整理、归置等辅助工作,而主要清洁工作仍然由保洁阿姨完成。
有网友调侃,这不像机器人保洁,更像机器人来家里实习。
某种意义上,自变量确实兑现了王潜此前“让机器人进入真实家庭”的承诺。只是距离大众想象中的“机器人保姆”,今天的人形机器人显然还有相当长的一段路要走。
对此,自变量并非毫无认知。
事实上,家庭场景恰恰是机器人行业公认最困难的应用场景之一。过去两年,人形机器人率先落地的场景大多集中在工厂、仓储和物流中心。这些环境虽然同样复杂,但至少拥有相对固定的流程、工位和操作对象。机器人每天面对的任务大同小异,只要经过足够多次重复训练,就能够不断提高成功率。
家庭则完全不同。没有两户家庭是一样的,也没有哪个家庭会永远保持同一个样子。
物品摆放位置随时变化,光照条件不断改变,用户习惯千差万别。机器人今天需要整理书桌,明天可能要叠衣服、收拾玩具,后天又可能被宠物打断工作。
对于具身智能来说,这些都属于典型的长尾场景。而长尾场景最大的特点,就是很难依靠少量样本覆盖。
机器人想学会如何应对这些情况,就必须经历大量真实环境中的交互与试错。
也正因为如此,尽管机器人在家庭中的表现还远远称不上成熟,自变量依然选择如此积极地进入真实家庭。
自变量首席运营官杨倩曾表示,家庭场景是检验通用机器人的终极考场。与58到家的合作,让公司能够获得真实且宝贵的场景数据与用户反馈,从而加速机器人能力迭代。
相比说服用户直接花数十万元购买一台机器人,149元一次的家政服务,显然更容易激发普通人的尝鲜意愿。
而当我们看到的是机器人免费也要上门擦桌子、收鞋子时,自变量更关心的,或许是机器人在这个过程中产生的数据。
对于今天的具身智能行业来说,数据的重要性正在迅速提升。
机器人做错的每一个动作、遇到的每一种意外、完成任务时的每一次犹豫,背后都对应着真实世界里的一个具体场景。
而这些场景,恰恰是机器人未来最需要学会处理的问题。
数采大生意
对于今天的人形机器人行业来说,数据的重要性,正在越来越接近大模型时代的语料。
ChatGPT之所以能够理解和生成语言,本质上是因为读过海量文本。
而机器人想学会干活,同样需要大量数据。区别在于,文本可以直接从互联网获取,但机器人需要的数据,却存在于真实世界。
机器人想学会擦桌子,就需要知道不同材质桌面的差异;想学会叠衣服,就需要理解衣物的软硬程度和受力变化;想学会收纳杂物,则必须面对各种形状、位置和摆放方式完全不同的物体。
这些能力,很难通过阅读一本说明书获得,只能来自一次又一次真实操作。
这也是为什么,当外界还在讨论机器人什么时候进工厂、什么时候进家庭时,越来越多机器人公司已经把注意力放在另一件事情上:收集数据。
甚至可以说,今天很多机器人最大的工作,并不是干活,而是学习怎么干活。
IDC数据显示,2025年人形机器人出货量中,商演、科研和数据采集场景占比达到78.4%,真正进入工厂等终端场景创造生产价值的比例还不到两成。
换句话说,看起来热火朝天的人形机器人产业,相当一部分机器人仍然处于“上学阶段”。
而围绕这些机器人的学习需求,一门新的生意也开始快速成长。
今年3月,京东宣布在江苏宿迁建设全球最大的具身智能数据采集中心,将发动数十万人参与数据采集,包括内部超过10万名员工,以及外部50万名社会人员。
![]()
截至2026年4月,全国类似的数据采集中心已经达到64个。
更有意思的是,参与数据采集的人,未必需要具备机器人专业背景。有人负责遥控机器人完成动作,有人佩戴头显和摄像设备完成指定任务,还有人直接在家里洗碗、叠衣服、整理房间,把自己的动作记录下来提供给机器人学习。
从某种程度上说,人类正在成为机器人的“老师”。而随着具身智能持续升温,一批专门从事数据采集与标注的公司也开始获得资本追捧。
光轮智能估值突破20亿美元,曼孚科技、新智等企业相继获得融资。越来越多创业公司不再直接造机器人,而是专门生产机器人训练所需要的数据。
数采行业突然繁荣的背后,其实折射着同一个现实:整个行业都在缺数据。
业内普遍认为,真正具备通用能力的人形机器人,需要数千万甚至上亿小时高质量操作数据,而目前全行业积累的数据规模仍然只有几十万小时量级,两者之间存在巨大的缺口。
更麻烦的是,机器人数据远不像互联网文本那样容易复用。工厂里的拧螺丝数据,很难直接迁移到家庭收纳;商场里的导购数据,也无法直接用于医院护理。甚至同一家工厂,不同工位产生的数据都未必能够通用。
数据不仅少,而且贵。
在真机遥操作模式下,一名熟练操作员工作8小时,往往只能产出2至3小时有效数据;而头戴设备进行无本体采集时,真正有训练价值的数据占比也只有3%至20%。
这也解释了为什么越来越多机器人公司开始主动进入真实场景。因为对于具身智能来说,真正稀缺的从来不是机器人本身。而是机器人背后那些能够反复训练、持续迭代的真实世界数据。
机器人保姆,还是机器人训练场?
如果说机器人进入家庭是在寻找数据,那么自变量最近开源的XRZero-GO,则是在解决另一个问题:如何让数据变得更便宜、更高效。
随着具身智能持续升温,行业对于数据重要性的认知已经高度一致。无论是大规模建设数采中心,还是发动数十万人参与数据采集,本质上都在解决机器人缺少足够的“学习资料”。
但随着行业不断扩张,一个新的问题也开始浮现:数据当然重要,可获取数据的成本同样惊人。
在传统方案中,高质量机器人数据往往需要通过真机遥操作采集。设备昂贵、人工投入高、采集效率有限,使得数据规模的增长速度很难跟上模型训练需求。
大部分公司的思路都是继续扩大规模。缺数据,就建设更多数采中心;采集效率不够,就投入更多人力和设备。
而自变量尝试的则是另一条路:与其不断增加数据获取成本,不如提高数据利用效率。
按照自变量公布的实验结果,1小时真机数据搭配10小时高质量无本体数据,就能够接近纯真机训练效果,整体成本则下降到原来的二十分之一。与此同时,项目还加入自动质检机制,对动作合理性、执行结果以及物理约束进行多轮筛选,尽可能减少低质量数据进入训练流程。
对于一个仍处于早期阶段的行业来说,这样的意义并不仅仅是节省成本。过去两年,行业普遍在思考如何获得更多数据,而自变量试图解决的,则是如何让同样的数据创造更大价值。
如果把XRZero-GO和机器人保洁服务放在一起看,自变量最近一系列动作背后的逻辑也开始变得清晰。一边,它在想办法降低机器人学习的成本;另一边,它又在想办法扩大机器人接触真实世界的机会。前者是在提高学习效率,后者是在增加学习素材。
某种程度上,两件事其实都在围绕同一个目标展开:让机器人更快成长。
这或许也是自变量与不少同行最大的不同:比起展示机器人学会了什么,它似乎更关心机器人如何更快学会。
这个逻辑也不难理解,因为任何具体技能都有边界。今天学会叠衣服,并不意味着明天就能整理厨房;学会收纳鞋子,也不意味着能够照顾老人。真正决定机器人能力上限的,未必是已经掌握了多少技能,而是获取新技能的速度。
过去几年,人形机器人行业一直在讨论一个问题:机器人究竟是先拥有能力,再进入家庭;还是先进入家庭,再获得能力。从自变量最近一系列动作来看,它似乎更相信后者。
至少从今天来看,那些进入家庭的机器人还会在玄关迷路,会找不到鞋柜,也会把刚叠好的枕巾掉在地上。
但对于机器人公司来说,这些失误未必毫无价值。因为每一次判断错误、每一次任务失败、每一次意料之外的情况,背后都对应着真实世界里的一个场景。
而这些场景,恰恰是机器人未来最需要学会处理的问题。
某种程度上,149元一次的机器人保洁服务,你以为自己是在体验机器人,但对于机器人来说,这更像是一堂付费实践课。它通过不同家庭里的桌子、鞋柜、衣物和杂物,学习如何理解真实世界。
从这个角度看,越来越多普通家庭正在承担一种新的角色:
我们的家既是未来机器人的服务对象,也是下一代机器人的训练场。
参考资料:
- 镧瞳AI《遍地数采,谁能做成一门好生意?》
- 大虾条《全国64个数据采集中心,才是人形机器人真正的金主》
- Vista看天下《“在家洗碗就能赚钱”,这份新兼职让几万人把自己“卖”给了 AI》







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论