149元请机器人上门保洁，自变量的野心藏不住了-钛媒体官方网站

文 | 金角财经，作者 | Chester

机器人开始进家门了。

最近一年，人形机器人最热闹的故事，大多发生在工厂里。

搬箱子、拧螺丝、分拣货物、上下料……几乎所有头部机器人公司都在争夺制造业场景，希望率先实现规模化落地。

原因并不复杂。相比家庭，工厂拥有更标准的流程、更固定的工位和更明确的工作目标，是现阶段机器人最容易创造价值的地方。

但就在行业集体涌向工厂的时候，获得字节跳动、美团、阿里巴巴、小米等资本支持的自变量，却把目光投向了另一个方向：家庭。

今年以来，自变量频繁展示机器人在家庭场景中的能力。与58到家合作推出机器人保洁服务，让机器人跟随保洁人员进入真实家庭；发布会上，机器人自主整理杂物、捡起随机丢弃纸团的视频，也在社交媒体上广泛传播。

这多少有些反常识。因为家庭恰恰是机器人行业公认最复杂、最难落地的场景之一。从实际体验来看，今天的人形机器人距离“机器人保姆”还有相当长的路要走。

有体验者发现，机器人收拾书桌时，一个简单动作往往要思考数分钟；整理鞋子时，甚至找不到鞋柜的位置。很多时候，保洁阿姨一分钟完成的工作，机器人可能需要折腾半小时。

既然如此，自变量为什么还要急着把机器人送进家庭？

最近，自变量开源的XRZero-GO项目，或许提供了一个新的观察视角。

这套方案不仅开放了覆盖3000多个任务的训练数据，还公布了一套大幅降低机器人数据采集成本的方法。消息公布后，很快引发行业关注。

原因在于，它触碰到了当下具身智能行业最现实的瓶颈之一——数据。

对于今天的人形机器人来说，家庭不仅意味着未来潜在的商业市场，也意味着真实世界中最丰富、最复杂、最难复制的数据来源。

如果把机器人保洁和XRZero-GO放在一起看，自变量正在做的，或许是一件事的两个侧面：一边降低获取数据的成本，一边寻找更多真实数据的来源。

而我们越来越多的普通家庭，也正在成为下一代机器人的训练场。

自变量为什么盯上家务活？

最近，一段机器人上门做保洁的视频，在社交平台上引发不少讨论。

视频里，机器人跟着保洁阿姨一起进入家庭，负责整理桌面、归置物品、收纳鞋子。看上去，“机器人保姆”似乎离现实生活越来越近了。

这正是自变量与58到家合作推出的机器人保洁服务。

收费标准与普通家政服务接近，但上门的不只有保洁阿姨，还有机器人和机器人工程师。

很多人最关心的问题也很直接：机器人保洁，到底已经发展到什么程度了？

AI科技博主“葬爱咸鱼”体验过这项服务，但真实表现与很多人的想象存在不小落差。

机器人刚进门，就在玄关附近卡了10分钟。

开始整理书桌后，一个简单动作往往需要思考一两分钟。收拾鞋子时，它能够识别出鞋子，却判断不出鞋柜的位置，只能把鞋放在鞋柜下方。机械手刚拿完鞋子，又直接去叠枕巾，结果枕巾没拿稳掉到了地上，前面的清洁工作也白费了。

整个过程中，机器人承担的更多是整理、归置等辅助工作，而主要清洁工作仍然由保洁阿姨完成。

有网友调侃，这不像机器人保洁，更像机器人来家里实习。

某种意义上，自变量确实兑现了王潜此前“让机器人进入真实家庭”的承诺。只是距离大众想象中的“机器人保姆”，今天的人形机器人显然还有相当长的一段路要走。

对此，自变量并非毫无认知。

事实上，家庭场景恰恰是机器人行业公认最困难的应用场景之一。过去两年，人形机器人率先落地的场景大多集中在工厂、仓储和物流中心。这些环境虽然同样复杂，但至少拥有相对固定的流程、工位和操作对象。机器人每天面对的任务大同小异，只要经过足够多次重复训练，就能够不断提高成功率。

家庭则完全不同。没有两户家庭是一样的，也没有哪个家庭会永远保持同一个样子。

物品摆放位置随时变化，光照条件不断改变，用户习惯千差万别。机器人今天需要整理书桌，明天可能要叠衣服、收拾玩具，后天又可能被宠物打断工作。

对于具身智能来说，这些都属于典型的长尾场景。而长尾场景最大的特点，就是很难依靠少量样本覆盖。

机器人想学会如何应对这些情况，就必须经历大量真实环境中的交互与试错。

也正因为如此，尽管机器人在家庭中的表现还远远称不上成熟，自变量依然选择如此积极地进入真实家庭。

自变量首席运营官杨倩曾表示，家庭场景是检验通用机器人的终极考场。与58到家的合作，让公司能够获得真实且宝贵的场景数据与用户反馈，从而加速机器人能力迭代。

相比说服用户直接花数十万元购买一台机器人，149元一次的家政服务，显然更容易激发普通人的尝鲜意愿。

而当我们看到的是机器人免费也要上门擦桌子、收鞋子时，自变量更关心的，或许是机器人在这个过程中产生的数据。

对于今天的具身智能行业来说，数据的重要性正在迅速提升。

机器人做错的每一个动作、遇到的每一种意外、完成任务时的每一次犹豫，背后都对应着真实世界里的一个具体场景。

而这些场景，恰恰是机器人未来最需要学会处理的问题。

数采大生意

对于今天的人形机器人行业来说，数据的重要性，正在越来越接近大模型时代的语料。

ChatGPT之所以能够理解和生成语言，本质上是因为读过海量文本。

而机器人想学会干活，同样需要大量数据。区别在于，文本可以直接从互联网获取，但机器人需要的数据，却存在于真实世界。

机器人想学会擦桌子，就需要知道不同材质桌面的差异；想学会叠衣服，就需要理解衣物的软硬程度和受力变化；想学会收纳杂物，则必须面对各种形状、位置和摆放方式完全不同的物体。

这些能力，很难通过阅读一本说明书获得，只能来自一次又一次真实操作。

这也是为什么，当外界还在讨论机器人什么时候进工厂、什么时候进家庭时，越来越多机器人公司已经把注意力放在另一件事情上：收集数据。

甚至可以说，今天很多机器人最大的工作，并不是干活，而是学习怎么干活。

IDC数据显示，2025年人形机器人出货量中，商演、科研和数据采集场景占比达到78.4%，真正进入工厂等终端场景创造生产价值的比例还不到两成。

换句话说，看起来热火朝天的人形机器人产业，相当一部分机器人仍然处于“上学阶段”。

而围绕这些机器人的学习需求，一门新的生意也开始快速成长。

今年3月，京东宣布在江苏宿迁建设全球最大的具身智能数据采集中心，将发动数十万人参与数据采集，包括内部超过10万名员工，以及外部50万名社会人员。

截至2026年4月，全国类似的数据采集中心已经达到64个。

更有意思的是，参与数据采集的人，未必需要具备机器人专业背景。有人负责遥控机器人完成动作，有人佩戴头显和摄像设备完成指定任务，还有人直接在家里洗碗、叠衣服、整理房间，把自己的动作记录下来提供给机器人学习。

从某种程度上说，人类正在成为机器人的“老师”。而随着具身智能持续升温，一批专门从事数据采集与标注的公司也开始获得资本追捧。

光轮智能估值突破20亿美元，曼孚科技、新智等企业相继获得融资。越来越多创业公司不再直接造机器人，而是专门生产机器人训练所需要的数据。

数采行业突然繁荣的背后，其实折射着同一个现实：整个行业都在缺数据。

业内普遍认为，真正具备通用能力的人形机器人，需要数千万甚至上亿小时高质量操作数据，而目前全行业积累的数据规模仍然只有几十万小时量级，两者之间存在巨大的缺口。

更麻烦的是，机器人数据远不像互联网文本那样容易复用。工厂里的拧螺丝数据，很难直接迁移到家庭收纳；商场里的导购数据，也无法直接用于医院护理。甚至同一家工厂，不同工位产生的数据都未必能够通用。

数据不仅少，而且贵。

在真机遥操作模式下，一名熟练操作员工作8小时，往往只能产出2至3小时有效数据；而头戴设备进行无本体采集时，真正有训练价值的数据占比也只有3%至20%。

这也解释了为什么越来越多机器人公司开始主动进入真实场景。因为对于具身智能来说，真正稀缺的从来不是机器人本身。而是机器人背后那些能够反复训练、持续迭代的真实世界数据。

机器人保姆，还是机器人训练场？

如果说机器人进入家庭是在寻找数据，那么自变量最近开源的XRZero-GO，则是在解决另一个问题：如何让数据变得更便宜、更高效。

随着具身智能持续升温，行业对于数据重要性的认知已经高度一致。无论是大规模建设数采中心，还是发动数十万人参与数据采集，本质上都在解决机器人缺少足够的“学习资料”。

但随着行业不断扩张，一个新的问题也开始浮现：数据当然重要，可获取数据的成本同样惊人。

在传统方案中，高质量机器人数据往往需要通过真机遥操作采集。设备昂贵、人工投入高、采集效率有限，使得数据规模的增长速度很难跟上模型训练需求。

大部分公司的思路都是继续扩大规模。缺数据，就建设更多数采中心；采集效率不够，就投入更多人力和设备。

而自变量尝试的则是另一条路：与其不断增加数据获取成本，不如提高数据利用效率。

按照自变量公布的实验结果，1小时真机数据搭配10小时高质量无本体数据，就能够接近纯真机训练效果，整体成本则下降到原来的二十分之一。与此同时，项目还加入自动质检机制，对动作合理性、执行结果以及物理约束进行多轮筛选，尽可能减少低质量数据进入训练流程。

对于一个仍处于早期阶段的行业来说，这样的意义并不仅仅是节省成本。过去两年，行业普遍在思考如何获得更多数据，而自变量试图解决的，则是如何让同样的数据创造更大价值。

如果把XRZero-GO和机器人保洁服务放在一起看，自变量最近一系列动作背后的逻辑也开始变得清晰。一边，它在想办法降低机器人学习的成本；另一边，它又在想办法扩大机器人接触真实世界的机会。前者是在提高学习效率，后者是在增加学习素材。

某种程度上，两件事其实都在围绕同一个目标展开：让机器人更快成长。

这或许也是自变量与不少同行最大的不同：比起展示机器人学会了什么，它似乎更关心机器人如何更快学会。

这个逻辑也不难理解，因为任何具体技能都有边界。今天学会叠衣服，并不意味着明天就能整理厨房；学会收纳鞋子，也不意味着能够照顾老人。真正决定机器人能力上限的，未必是已经掌握了多少技能，而是获取新技能的速度。

过去几年，人形机器人行业一直在讨论一个问题：机器人究竟是先拥有能力，再进入家庭；还是先进入家庭，再获得能力。从自变量最近一系列动作来看，它似乎更相信后者。

至少从今天来看，那些进入家庭的机器人还会在玄关迷路，会找不到鞋柜，也会把刚叠好的枕巾掉在地上。

但对于机器人公司来说，这些失误未必毫无价值。因为每一次判断错误、每一次任务失败、每一次意料之外的情况，背后都对应着真实世界里的一个场景。

而这些场景，恰恰是机器人未来最需要学会处理的问题。

某种程度上，149元一次的机器人保洁服务，你以为自己是在体验机器人，但对于机器人来说，这更像是一堂付费实践课。它通过不同家庭里的桌子、鞋柜、衣物和杂物，学习如何理解真实世界。

从这个角度看，越来越多普通家庭正在承担一种新的角色：

我们的家既是未来机器人的服务对象，也是下一代机器人的训练场。

参考资料：

镧瞳AI《遍地数采，谁能做成一门好生意？》
大虾条《全国64个数据采集中心，才是人形机器人真正的金主》
Vista看天下《“在家洗碗就能赚钱”，这份新兼职让几万人把自己“卖”给了 AI》