2022年10月25日来源:42号车库
昨天晚上 8 点,小鹏 1024 科技日如期举行,核心主题有 4 个:
智能驾驶
智能交互
智能机器人
飞行汽车
我们最为关注的自然是「智能驾驶」,活动现场吴新宙博士直接给出了 XNGP 的推送时间。
G9 Max 版 XNGP 发布计划:
2022 交付即有高速 NGP、记忆泊车等功能;
2023 上半年城市 NGP 发布,支持广州、深圳,新增首发上海,全国范围开放红绿灯识别并直行通过路口的能力;
2023 下半年大部分无图城市开放变道、超车、左右转能力;
2024 全场景打通,实现从车位到车位的智能导航辅助驾驶能力。
P5 E 版 & P7 E 版 XPILOT 发布计划:
2022-2023 上半年开放红绿灯识别、车道级导航功能;
2023 下半年高速 NGP 策略优化(限速调节、脱手检测等)。
其中最大的亮点莫过于在 2023 年上半年会在 G9 Max 版本车型上推送城市 NGP,并且支持上海,这个时间点,相比同为新势力的蔚来和理想则至少有超过 1 年以上的领先,以至于我在看完之后,真的有下单 G9 的冲动。
明确了接下来的迭代计划,我们回到发布会,看看小鹏拿什么支撑接下来的更新计划。
今年的发布会上,吴新宙博士提出的第一个问题就是:为什么要做难百倍以上的城市场景?
恰巧我们今年 9 月在社区中讨论过这个问题,到底应该继续打磨高速领航还是尽早上城市领航。
72 人参与,65% 支持继续打磨高速领航,35% 支持尽早上城市领航。
活动现场吴新宙博士抛了一组数据:
用户用车里程中城市道路占比 71%
用户用车时长城市道路占比 90%
途径城市道路的用户 100%
这个是用户总用车场景的数据统计。
城区辅助驾驶周渗透率 84%
城市 NGP 里程渗透率 63%
通行效率相比人类驾驶员 90%
平均百公里被动接管次数 0.6 次
这是小鹏 P5 城市 NGP 推送之后产生的数据,数据显示每 100 km 可使用城市 NGP 的道路,就有 63 km 是城市 NGP 在工作。
显然,城市场景就是用户的高频场景和刚需场景,但是为什么大家都希望继续打磨高速领航功能?
从大部分用户的评论中可以看出,大家在希望继续打磨高速领航功能的核心原因在于预设了一个立场:因为城市场景过于复杂,现在的技术下城市领航一定不好用,所以不如去打磨高速领航。
在这种逻辑下,去打磨高速领航似乎是一个很合理举动,但是再回头看看上面这组数据,并不是我们不需要,而是我们认为做不到。
而无论是特斯拉还是小鹏汽车,他们在决定去攻克城市场景的时候,目标必然是推出一个「好用的城市领航」功能。
也正是这种从终局思考问题的逻辑,才让他们能够正视困难,并且努力克服。
就像一条好走的路,和一条难走但正确的路,特斯拉和小鹏都选择难走但正确的路。
至于这里的难度,吴新宙博士同样给了一组相对量化的数据:
城市 NGP 的代码量是高速 NGP 的 6 倍;
城市 NGP 感知模型的数据是高速 NGP 的 4 倍;
预测/规划/控制相关的代码是高速 NGP 的 88 倍。
这还是在有高精地图辅助情况的数据对比,而小鹏也明确表示,目标在明年下半年做到无图城市开放道路的变道、超车、左右转能力。
为了克服城市场景的各种刁钻场景,小鹏从「感知」这个源头开始解决问题。
在发布会上,吴新宙首次对外透露,在 G9 上小鹏将采用 XNet 全新一代感知架构。
处理方式和特斯拉类似,均会将周身摄像头的感知结果输入 Transformer 神经网络,进行多帧时序前融合,输出 BEV 视角下动态目标物的 4D 信息和静态目标物的 3D 信息。
简单来说就是,原来的技术框架下,相当于让你通过多个只有模糊位置关联的视角、通过多张类似于连环画的图片来感知周围的世界,而且还要判断周围车辆的速度预测他们的行驶轨迹。
这样的感知结果下,哪怕是让一个老司机来判断,也是十分困难的。
而现在的技术框架下,系统会直接输出一个带周围车辆动态信息的上帝视角。
这样操作带来的好处是可以大幅提升静态目标物的 3D 信息监测的精度。用吴新宙的话来说就是:「这套感知架构有实时产生高精地图的能力。」
更精准的动态目标物的 4D 信息,也意味着系统可以做到更强的变道能力和博弈能力。
当然这套强大的大模型神经网络也不是说有就有的。
活动现场吴新宙博士透露,强大的 XNet 背后,用了最新的 Transformer 网络架构,为了顺利部署这套大模型网络,需要 50—100 万的短视频来进行训练优化,如果直接部署,不做优化则需要吃掉超过一个 Orin-X 的算力。
但是,这些视频中动态目标的数量是以亿为单位,如果以人工的方式进行标注,这至少需要 2,000 个人 1 年的时间。
为了解决这个问题,小鹏的自动驾驶团队开发了一套「自动标注系统」,把标注的时间压缩到了 16.7 天。
然后是训练。
今年 8 月小鹏汽车宣布在乌兰察布建成中国最大的自动驾驶智算中心「扶摇」,用于自动驾驶模型训练,算力达到 600 PFLOPS,效率相比原来提升了 602 倍。
接下来小鹏也会通过持续的「采集」、「标注」、「训练」、「部署」来完善这套模型。
据吴新宙博士透露,目前小鹏有接近 10 万辆用户的车具备数据采集能力,并且在车端设置了超过 300 个触发信号,系统可以判断当前怎么样的 Corner Case 是对系统有用的,然后进行上传,采集的数据包括车外的动态、静态物体,也包括全栈的数据。
最后,小鹏提出了一个新的概念「全场景辅助驾驶——XNGP」,相比现在的 XPilot,能力更强,覆盖范围更广,小鹏汽车的目标是在无图地区把城市 NGP 的体验做到无限接近于有图地区。
再回到「应该继续打磨高速领航还是尽早上城市领航」这个话题,答案是显而易见的,在现有技术路线下,虽然可以把城市导航辅助驾驶的体验打磨到一个比较好的状态,但是注定做不到城市领航辅助。
如果拿造房子来比喻,你的目标是造一栋 100 层的摩天大楼,小鹏在做的是为了实现 100 层的高度,重构可以支撑住的地基。
而还在打磨高速导航辅助驾驶的车企更像是在一个只能承载 3 层楼的地基,给这 3 层楼做了一个豪华的装修,就算装修得再好,仍然需要从地基开始重建。
今年 1024 的第二个重点是「全场景语音」。
在 2020 年小鹏汽车首次提出了全场景语音的概念,小鹏的目标是将语音打造成新的交互方式,可以做到平替物理按键的效果。
在 2020 年这套系统已经做到了「可见即可说」、「连续对话」、「多音区对话」等等,这些功能的出现把车载语音从一个不可用的状态拉到了一个可用的状态,推出之后也相继成为了许多车企模仿的对象,而今年,小鹏希望把语音从「可用」变为「好用」。
关于这套系统我们已经在之前的试驾中做过详细的体验,可以给出的明确结论是:这是目前能力最强的一套语音系统,也必将再次成为行业里追随的对象。
具体的亮点可以总结为以下 4 点。
免唤醒
无论是车上的语音助手还是智能家居的语音助手,对于社恐的人来说,最大的使用门槛就是「唤醒」,载着一车人的时候,或者家里来朋友的时候,唤醒语音助手这一下总有巨大的阻力。
但是语音助手就不能做到免唤醒吗?
可以,但很难。
有唤醒词的情况下,系统可以非常清晰地知道,你的接下来的这句话是对 ta 说的。
但是无唤醒词的情况下,系统需要自己判断你说的 10 句话中哪几句是和副驾说的,哪几句是和 ta 说的,这背后不仅需要系统具备出色的识别能力,更需要具备类似人类的语义判断能力。
而在小鹏 G9 上,免唤醒语音支持全车 4 个座位。
多音区同时对话
在 2020 款理想 ONE 上我们第一次体验到了多音区语音,但是受限于算力和技术,理想 ONE 的多音区只可以做到 4 路识别,1 路执行,说白了就是全车最多只能 1 个人使用语音。
而在 G9 上,小鹏做到了 4 路,车上的 4 个人可以同时向小 P 发出指令,并且小 P 会同时执行 4 个指令,这种感觉就像小 P 有了 4 个分身。
快
小鹏官方给出的数据是唤醒到界面反馈 245 ms、到语音反馈 700 ms。
在传统的语音助手上,乘客需要说完指令,系统才会进行识别,拿到识别的文本之后,再理解执行。
在 G9 上,小鹏参考了人类的思考方式,⼩ P 可以⼀边识别⽂本、⼀边实时理解及查询数据,在乘客话刚说完⼀瞬间,所有理解已经完成,这个就是流式理解。
这种逻辑下,交互的效率自然远高于上一种。
没网也能用
现有的语音助手所有的文本识别均需要通过网络上传到云端处理,所以在高速、隧道、地库等网络不好的环境下,语音则是一个完全不可用的状态。
基于 8155 芯片更大算力,小鹏在 G9 上实现了边缘计算,依靠车端的算力既可以识别并执行用户的指令。
用一句话总结这四点目标就是:降低人类的使用门槛。
看到 1024 发布会上小鹏城市 NGP 的规划,我发了一条微博:「G9 Max 会在 2023 年上半年交付城市 NGP,首发城市有上海,就因为这个还挺想买 G9 的。」
随后同事在评论区中写到:「G9 的智能化非常有吸引力,但 G9 没有。」
仔细想想,虽然 G9 并不至于没有吸引力,但是 G9 智能化的吸引力是大过于车的。
今年的 1024 是小鹏历史上最硬核的一届 1024,毫无疑问的是,小鹏的技术能力达到了一个全新的高度。
但比起往年,也是小鹏所处环境最复杂的一年,从最早的 G9 发布延期,到发布后的 SKU 调整,再到小鹏组织架构的调整,每一个事件传递出来的都是小鹏在解决一个又一个的问题。
从悲观的角度来看,小鹏现在确实存在很多问题,但是乐观来看,当小鹏解决掉一个又一个问题之后,小鹏也在变得越来越好。
就辅助驾驶现在的硬件成本和研发支出,在这个阶段必然需要一辆「贵」的车来承载。
从 G9 的配置来看是完全撑得起这个价格的,甚至可以说很有性价比,但是当价格超过 30 万,品牌的段位是消费者很难忽视的一个点。
E_Mail:vip@gxqcw.com 电话:15077070808 地址:南宁市青秀区滨湖路48号南湖聚宝苑D区15楼 桂ICP备06004827号 经营许可证编号:桂B2-20090044 |