具身智能是人工智能领域的前沿方向,正成为科技巨头争相布局的焦点。这项技术通过将AI模型与物理实体结合,让机器拥有感知、决策和执行物理任务的能力,有望彻底改变人类与AI的交互方式。2024年5月,OpenAI正式宣布成立Robotics事业部,这是这家以大模型著称的公司首次系统性切入机器人赛道,将AI的边界从软件延伸到了物理世界。
此次布局由OpenAI CEO山姆·奥特曼亲自牵头,通过官方博客及X(原Twitter)平台发布声明,公开招募全栈硬件工程师、机器学习工程师、系统架构师及运营专家,强调团队需具备跨领域整合能力,能将大模型技术与机器人硬件深度融合。奥特曼在声明中提到,AI的终极价值不仅在于处理数字信息,更在于解决现实世界中的实际问题——比如帮助老年人完成家务、提升工业生产效率、辅助医疗护理等。具身智能正是连接AI与物理世界的关键桥梁,能让AI从“云端”落地到“地面”,切实服务人类生活。
OpenAI的Robotics事业部将依托GPT-4o等多模态大模型技术,重点研发三大核心模块:环境感知模块通过摄像头、激光雷达等传感器获取物理世界数据,并借助大模型实时分析;决策规划模块基于自然语言指令和环境信息生成机器人的动作路径;运动控制模块则把大模型的决策转化为抓取、移动等具体动作。团队计划分阶段推进:短期(1-2年)聚焦核心技术验证,优化大模型与硬件的适配效率;中期(3-5年)推出原型机器人,并在实验室、家庭等特定场景测试;长期则目标实现机器人在多领域的规模化应用。
根据麦肯锡2024年发布的《具身智能发展报告》,全球具身智能市场规模预计从2024年的2000亿美元增长至2030年的1.5万亿美元,复合年增长率达35%,其中机器人应用占比超过60%。这一数据凸显了具身智能赛道的巨大潜力,也是OpenAI布局该领域的重要原因之一。
OpenAI并非唯一布局具身智能的科技巨头。谷歌DeepMind早在2022年就推出了具身智能模型RT-2,能直接将自然语言指令转化为机器人动作,目前已在分拣、搬运等任务中达到较高准确率;特斯拉的Optimus机器人已进入第二代原型测试阶段,计划2025年量产,目标成为家庭服务机器人的主流产品;国内的小米也推出了CyberOne机器人,具备情感交互和简单家务能力,目前已在部分线下门店展出。这些竞争对手的动作意味着OpenAI需要快速突破技术瓶颈,才能在赛道中占据优势。
2024年6月,OpenAI宣布了两项重要进展:一是招募前波士顿动力资深硬件工程师约翰·米勒加入Robotics事业部,负责机器人机械结构设计;二是与NVIDIA达成合作,利用其Jetson AGX Orin平台加速机器人的实时推理和训练,这将显著提升机器人的响应速度和决策效率。
OpenAI进军机器人赛道,凭借其在大模型领域的深厚积累,有望在具身智能的决策和自然语言交互方面形成差异化优势。不过,机器人研发涉及硬件设计、传感器集成、运动控制等多个复杂领域,OpenAI在硬件方面经验相对薄弱,需要与专业硬件厂商深度合作才能快速推进产品落地。此外,具身智能的场景适配难度不小,家庭、工业等不同场景对机器人的要求差异明显,如何打造通用化的机器人解决方案仍是行业共同面临的挑战。若能有效整合软硬件资源,OpenAI或将在具身智能领域开辟新的增长曲线。






快报