毫末要搞技术，也要搞钱｜钛度车库-钛媒体官方网站

为了快速实现商业化，毫末放大招了。

在 10 月 11 日的毫末 AI DAY 上，毫末一次性发布了 HP170、HP370、HP570 三款智驾产品，最低价格直接下探至 3000 元，打响了智驾产品千元级价格战。

另外，本次 AI DAY 也是毫末发布 DriveGPT 后的首次升级，而此次升级的重点，在于如何让大模型“通识万物”，让其在自动驾驶领域更像人类司机。

智驾产品价格下探到万元以下

“2023 年我国高阶智能辅助驾驶市场迎来大爆发。”毫末智行董事长张凯给出新判断。

张凯表示，目前乘用车销量和智能化指数都在稳步提升，同时智能驾驶渗透率与价格却呈反向增长，乘用车市场 L2 及以上智能驾驶渗透率达 42.4%，2025 年将达 70%，并普及到 10-20 万的主销车型上。

同时，城市 NOA 迎来量产上车潮，目前占 L2 及以上辅助驾驶份额的 17%，2025年将达 70%。

在毫末看来，行泊分体的硬件设计、一体机逐步退出市场，更具性价比的行泊一体的域控方案将成为主流。由此，在本次 AI DAY 上，毫末发布了 “HP170、HP370、HP570 三款”智能辅助驾驶产品，覆盖千元级别不同价位区间，分别来看：

HP170：3000 元级，可以实现行泊一体智驾。算力 5TOPS，传感器方案标配 1 个前视相机、4 个鱼眼相机、2 个后角雷达、12 个超声波雷达，能够选装 1 个前视雷达和 2 个前角雷达。

HP370：5000 元级，可以实现城市记忆行车与记忆泊车。算力 32TOPS，传感器方案标配 2 个前视相机、2 个侧视相机、1 个后视相机、4 个鱼眼相机、1 个前雷达、2 个后角雷达、12 个超声波雷达，灵活选装 2 个前角雷达。

HP570：8000 元级，可实现城市无图 NOH、全场景辅助泊车等功能。算力可选 72TOPS 和 100TOPS 两款芯片，传感器方案标配 2 个前视相机、4 个侧视相机、1个后视相机、4 个鱼眼相机、1 个前雷达、12 个超声波雷达，支持选配 1 颗激光雷达。

可以看到，毫末三款智能辅助驾驶产品将价格下探到万元以下，最低达 3000 元级别，从产品的各项配置来看，毫末在硬件使用上十分克制，无论是采用更低算力的芯片，还是减少传感器规模（舍弃激光雷达）、将高速无图领航压缩到单一 MCU 等，都是其实现成本压缩的表现。

张凯在会后交流中表示，长期来看依然是视觉+激光雷达的路线，现阶段是为了将智驾产品更快的推向市场，实现快速商业化的目的。

同时，对于智驾产品的价格下探，张凯认为这是技术迭代的阶段性成果，基于一些轻量化工作的布局，此前需要在大算力平台布局的能力目前在中等算力平台基本也能够布局下。值得一提的是，毫末三款产品采用的芯片除了高通 Ride 的 SA8650 芯片，还采用了地平线征程 3、TI 的 TDA4。

毫末方面称，这三款智能辅助驾驶产品预计将在 2023 年和 2024 年先后上车，其中 8000 元级城市全场景无图 NOH 目前正处在功能验证阶段。

在上一届 AI DAY 上，毫末曾透露其辅助驾驶产品 HPilot 已拿到 3 家主机厂的订单，其中一家为长城汽车，另外两家尚未公开。

在此次 AI DAY 上，毫末给出了其辅助驾驶产品 HPilot 最新数据情况： HPilot 整体已搭载至超过 20 款车型，用户辅助驾驶行驶里程突破 8700 万公里。其中，最新搭载毫末 HPilot 的车型为山海炮 HEV 版、新摩卡 Hi-4S 等。

DriveGPT 又有哪些新进展？

除了公开商业化动态，毫末每一届 AI DAY 的重点也都会放在技术升级方面。

毫末在上一届 AI DAY 上推出了自动驾驶领域的生成式大模型 DriveGPT，并将原来的感知和认知相关大模型能力整合其中。

在 DriveGPT 大模型推出 200 天后，其训练数据规模有了进一步提升，截止 2023 年10月，DriveGPT 共计筛选出超过 100 亿帧互联网图片数据集和 480 万段包含人驾行为的自动驾驶 4D Clips 数据。

按照毫末的规划，在数据驱动的自动驾驶 3.0 时代，感知阶段需要通过海量的数据训练感知基础模型，学习并认识客观世界的各种物体；在认知阶段，则通过海量司机的驾驶行为数据学习驾驶常识，通过数据驱动的方式不断迭代并提升整个系统的能力水平。

毫末认为，人类在开车时不只是基于基础交通规则的理解，还具备对物理世界的认知能力，如果只是基于车端传感器的数据进行训练无法穷尽各种路面情况，也就无法像人类一样理解万物之间的联系、事件发生的逻辑和背后的常识，并且基于这些人类社会的经验来做出更好的驾驶策略。

基于这种判断，毫末在 DriveGPT 的基础上，在感知大模型中新增加图文多模态大模型，在认知大模型中增加大语言模型 LLM，使其具备通用感知和通用认知的能力。

在此前 AI DAY 上，DriveGPT 已经通过构建视觉感知大模型来实现对真实物理世界的学习，包括路面、天气、光照等局部和全局的语义信息，将真实世界建模到三维空间，再加上时序形成 4D 向量空间。

在构建对真实物理世界的 4D 感知基础上，毫末此次进一步引入开源的图文多模态大模型，构建更为通用的语义感知大模型，实现文、图、视频多模态信息的整合，从而完成 4D 向量空间到语义空间的对齐，实现跟人类一样的“识别万物”的能力。

毫末智行数据智能科学家贺翔举了一个现实例子，以往的模型只能识别车道线、红路灯等交通信息，对于路面出现的杂草、塑料袋、猫狗小动物等都只能识别成障碍物，无法像人类一样了解现实世界，而图文多模态大模型的引进则是为了解决这一问题。

有了“识别万物”的能力之后，还得让其了解识别到的物体背后的物理知识。DriveGPT 先通过构建驾驶语言（Drive Language）描述驾驶环境和驾驶意图，再结合导航引导信息以及自车历史动作，并借助外部大语言模型 LLM 的海量知识来辅助给出驾驶决策。

也就是说，当识别出“杂草”之后，得让其知道“草可以被碾过”这一物理特性，毫末在认知大模型中增加了大语言模型 LLM 相当于植入了“大脑”，让大模型看懂并理解，从而作出更像人类的驾驶行为。

毫末 CEO 顾维灏表示，DriveGPT 大模型技术框架升级将在七大应用上得以实践，包括驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解释、驾驶环境预测和车端模型开发。

例如，在驾驶行为解释方面上，毫末 DriveGPT 通过引入大语言模型能够让 AI 自己解释自己的驾驶决策，而毫末只需通过构建自动驾驶描述数据对大语言模型进行微调，让大语言模型能够像驾校教练或者陪练一样，对驾驶行为做出更详细的解释。

当然，上述的技术进展都是云端层面的升级，如何让将能力下放到车端智驾系统是一大难题。毫末认为，车端智驾系统将从两个方面演进——逐步全链路模型化，以及逐步大模型化，未来车端、云端都是端到端的自动驾驶大模型。

据悉，毫末正在尝试用蒸馏的方法，也就是用大模型输出的伪标签作为监督信号，让车端小模型来学习云端大模型的预测结果，或者通过对齐 Feature Map 的方式，让车端小模型直接学习并对齐云端的 Feature Map，从而提升车端小模型的能力。

毫末表示，基于蒸馏的方法，车端的感知效果能够提升五个百分点。

要搞技术，也要搞钱

可以说，每一次的 AI DAY 都是是观察毫末技术进展的窗口，也是窥见其量产落地进度和商业化进程的途径。

结合此前 AI DAY 的各项动态可以看到，毫末从 1.0 到 3.0 时代的发展已经搭建了一整套相对完整的技术框架，构建了自动驾驶数据智能体系 MANA，结合大模型的行业发展，将感知和认知相关大模型能力统一整合到 DriveGPT 。

有了技术地基，毫末现在所做的工作是在这一基础上建楼。毫末指出，在自动驾驶3.0时代，以大数据、大模型为特征，以数据驱动为开发模式。自动驾驶在云端实现感知大模型和认知大模型的能力突破，并将车端各类小模型逐步统一为感知模型和认知模型，同时将控制模块也 AI 模型化，然后再将能力赋能到车端。

当然，再先进的技术，只有实现落地量产才能够具备商业价值。

今年以来，高阶智驾正迎来一次前所未有的上升期。公开数据显示，多家车企的用户选装/选购智驾版本车型正在快速提升。其中，小鹏 G6/G9 Max 版本的占比分别到达了 60% 和 80%；新款问界 M7 智驾版预定订单超过 3.3 万台，占比接近 66%；宝骏上个月发布的云朵灵犀版，用户选购智驾版本的占比达到了 80%。

市场的窗口正在打开，用户对智驾产品的接受度正在不断提升，这是智驾大规模普及的黄金期，也是各家厂商在市场站稳脚跟的关键占位期。

不同于以往堆硬件、堆性能的打法，伴随着一轮又一轮的价格战打响，用更具有价格优势开路已成为智驾普及的关键手段，这也就不难理解毫末在本次 AI DAY 上一次性发布 3 个千元级智驾产品，用张凯的话说， “这是 2023 年毫末给中国如此‘卷’的智驾市场交出的答卷。”

对于毫末而言，当下除了要搞技术，还要搞钱。只不过，最终能得到多高的成绩，还得看有多少厂商愿意为之买单。

（本文首发钛媒体App ，作者 | 肖漫，编辑 | 张敏）