本文来自微信公众号“赛博汽车”(ID:Cyber-car),作者:褚万博,未来汽车日报经授权发布。
是抄作业,还是英雄所见略同?
小鹏汽车2022年的1024科技日,下一代智能驾驶系统XNGP是绝对的主角。
85分钟的直播中,将近50分钟的画面都给了一个人——讲到嗓子沙哑的小鹏自动驾驶副总裁吴新宙。
从XNGP的新一代Xnet感知架构,到数据收集、标注、训练和部署的自监督自学习技术模型,还有XNGP系统详细的部署时间表。
技术细节足够硬核,且里里外外透着一股逐渐特斯拉化的味道。
当然,最后还少不了的一个彩蛋是:小鹏Robotaxi计划。
关于XNGP,吴新宙在近50分钟的时间里,分享了其与上一代的XPILOT系统的区别,以及软件技术细节。
根据官方的口径,XNGP未来将会成长为一个全场景辅助驾驶的系统,可以在无高精地图的前提下实现高阶智能辅助驾驶功能,最终的能力表现是超过大部分司机。
而XPILOT最终也将实现上述的能力,但最大的区别在于,无法脱离高精地图的运用。
在XNGP的能力进度表规划上,小鹏希望可以在2023年逐步落地全场景辅助驾驶,2025年之后开始向全面自动驾驶进发。
也因此,XNGP对于小鹏来说,可以理解为从辅助驾驶过渡到自动驾驶的最后一款智能驾驶系统,承上启下的意义不言而喻。
所以,这次的技术分享,也格外的硬核细致,归结起来一句话,感知进化和数据闭环,两大板块指向一个重点——城市场景的高级别辅助驾驶。
吴新宙表示,在城市场景落地高级别辅助驾驶,相对于高速和泊车两大场景,具有非常大的难点。
首先是需要面对场景相对更加复杂多变,比较典型的例子是,城市道路错综复杂,主干道和辅路情况更多,交通参与者的行为不够规范,改道施工比频繁等等。单是改道施工这一条,吴新宙表示,光是广州的路面平均一天就有两起,一年下来超过500次。
场景的复杂多变,也要求城市高级别辅助驾驶需要具备更强的能力,比如横向操控、不确定场景处理和博弈等等。
另外,基于这些难点,吴新宙还对高精地图的使用给出了自己的判断:城市高级别辅助驾驶,是基于车本身核心的感知能力进行判断。
一定程度上,吴新宙的态度已经能够说明在失去高精地图资质后,小鹏现在及未来智能驾驶思维的转变趋势——重感知轻地图路线。
所以落到感知上,小鹏在这次科技日上推出了新一代的感知架构——Xnet。
Xnet的特点就是多相机、多帧数据输入方式,简单理解一下就是,Xnet可以直接将连续的视频流数据输入深度学习大模型当中,然后直接输出在3维空间的结果,本质上是一种前融合的输出方式。而在此之前,小鹏的感知架构是通过多相机单帧的方式输入模型,后期再利用算法进行数据融合。
类比一下,整体类似于特斯拉在去年AI DAY上分享的基于视频流数据的共享特征多任务型神经网络架构。
而这种能力带来的优势是,可以让车辆具备超强的静态环视感知能力,即时生成高精地图,以此摆脱或者减轻对高精地图的依赖。
动态感知方面,Xnet感知架构也具备更强的360度感知,靠近车身的感知盲区得到加强,同时加入了速度感知和意图预测,使得系统的博弈能力和变道成功率更高。
以上就是小鹏在感知架构方面的最新进展,而感知之后,就是数据的处理和算法部署。
按照数据和算法的迭代关系,吴新宙将小鹏的整个数据闭环分成4大关节:数据收集、标注、训练和部署。
首先,数据收集层面上,小鹏在近10万辆的小鹏车型上部署了超过300个触发器,可以随时随地将场景数据收集上传。
其次,标注方面,多相机多帧的输入也意味着数据量的大幅增长。比如训练一个视频流输入的网络,就需要50-100万个短视频,需要标志的动态数据数以亿计。
为此,小鹏引入全自动的标注系统,对比人工标注,全自动标注系统效率高,过去2000个人一年的标注任务,现在用16天左右就能完成,效率可以提升45000倍。另外在数据的质量和信息全面性上,全自动标注系统也更有优势。
关于模型训练的部分,算力庞大的智算或超算中心,似乎成为自动驾驶玩家的共同选择。
就在前不久,小鹏与阿里合作建设扶摇智算中心,据了解,该智算中心的算力可以达到600PFLOPS,原来需要276天才能训练完成的模型,现在可以缩短到11个小时,效率提升超过600倍。
最后是算法部署,小鹏在这方面最新的进展是,对Transformer算子做了完全的重构。也因此,算法模型的运行效率和算力利用率,得到了非常大的优化。
小鹏披露,重构算子之后,算法的运行时间获得2.9倍的增益,运算时间有了20倍的缩减。同时,小鹏还通过剪枝算法,完成了2.9倍的模型加速。
这些数字落实到算力利用率上,吴新宙给出了一组数据:原来需要一颗Orin芯片1.22倍算力的模型,只需要用到9%的算力。
而上面一整个数据处理和算法迭代的核心,是一个全闭环、自成长的AI数据体系。
根据吴新宙的介绍,这个AI数据体系可以分成两个部分,分别处理真实数据和仿真数据,而体系的核心则是一个自监督学习的技术网络——黄金骨干模型。
通过这个黄金骨干模型,车辆遇到的某个corner case,比如异形车辆数据,会自动上传云端,并找出大量的同类真实场景数据输入模型中进行训练。
而仿真数据的处理不同,一些在真实场景罕有的corner case,一旦被采集到就会通过UE引擎产生具备真值的同类仿真场景,之后再输入到模型进行训练。
同样按照这个流程操作,不同之处在于,一些非常难以遇到的corner case,在上传之后会通过UE引擎产生具备真值的仿真数据。
而这个黄金骨干模型,带来的核心优势就一个字:快。吴新宙表示,通过黄金骨干模型,XNGP技术网络的提升和发布模型训练解耦,新的corner case出现,只需要在现有的基干网络上进行优化,不需要从头训练。好处就是,算法的迭代速度和成本可以大幅优化。
以上,就是XNGP的全部细节,在最后,吴新宙还给出了一个One more thing:Robotaxi。
就在不久之前,小鹏G9通过了封闭道路的自动驾驶测试,目前已获得智能网联汽车道路测试许可。也就是说,小鹏G9作为Robotaxi的承载车型,上路的牌照已经到手了,下一步就是具体的落地上路。
根据规划,小鹏Robotaxi将会在明年或后年出现在广州街头,在有安全员的前提下载客运营。
所有关于XNGP的软件细节全部讲完了,是不是挺硬核?
而消化这些干货的同时,我们也可以发现一个现象,小鹏的智能驾驶软件方案,越发的特斯拉化了。
小鹏XNGP软件方案的每一个部分,包括多相机多帧的视频流输入方式、速度感知和意图预测的动态感知、全自动数据标注和自监督自学习模型,甚至是大算力智算中心扶摇的建设和自学习,几乎都能在特斯拉近两年的AI DAY上找到对标。
甚至用量产乘用车作为Robotaxi车辆,也是马斯克一开始的态度,只是后来这个flag被无限期延长而已。
而这个现象,已经不单单只有小鹏一家,毫末智行也是积极的在两家的AI DAY上找相同。
所以是大家抄作业,还是英雄所见略同,最后都得殊途同归呢?
需要注意的是,XNGP目前还是一个期货产品,今年交付的小鹏G9 MAX版(其他版本仅支持XPILOT)仅有高速NGP、记忆泊车、LCC、智能泊车等能力。
城市NGP,需要等到明年上半年才能上车,届时将有广州、深圳和上海三座城市支持城市NGP。
到明年下半年,XNGP就可以在全国大部分无高精地图城市,落地城市NGP核心的开放变道、超车和左右转功能。
最终,2024年,高速、城市开放道路以及泊车全场景打通,实现车位到车位的智能导航辅助驾驶能力,而且是脱离高精地图的那种。
从这个时间规划表来看,小鹏重感知轻地图的技术转型,现在还处在早期阶段。
另外,上一代智驾系统XPILOT小鹏也没有放弃迭代,在这次科技日上,吴新宙给出了一个有点复杂的更新时间线(瞬间想到了G9发布会上那张让人看不懂的车型组合PPT)。
具体迭代的迭代节奏,请看下图:
以防大家看不懂,这里做个小总结,重点有3个(敲黑板敲黑板):
其一,到2023年下半年,XPILOT将会迭代到辅助驾驶能力的天花板,具体表现,应该就是在高精地图的支持下实现高速+城市NGP以及记忆泊车,无高精地图的地区,城市开放道路仅支持LCC基础上的红绿灯识别和车道级导航;
其二,开放高精地图的城市,只有广州、深圳和上海;
其三,XPILOT能力的集大成者车型将是小鹏P5 E版,想体验的朋友记得看准了再买。
智能座舱部分,最大的进展是,小鹏带来了全场景语音2.0。
据何小鹏介绍,全场景语音2.0首次将MIMO多音区技术应用在车载语音系统上,通过小鹏自研的语音架构,小鹏语音交互在功能上也迎来一些升级。
具体来看,主要有以下几点:
首先,全车多路语音流并行处理,支持处理四音区并发、端云一体、实时流式识别理解、并行指令等各种功能交织的语音交互请求;
其次,全车多个音区的上下文理解,同时既维护单人的对话和上下文管理;
最后,去掉唤醒词,语音全程待命,在网络状况较差的条件下,也能实现600多项车辆功能控制。
说到机器马和飞行汽车,今年的科技日多少有点“槽点大于看点”的意思。
小鹏汽车CEO何小鹏在科技日上表示,在过去一年中,对于机器马各个方面进行了诸多探索,比如运动的静谧性如何解决?如何在狭窄的环境具备避障能力,以及机械臂的多场景应用。
基于这些探索,今年展出的机器马……PPT,较去年来看有了比较大的变化,比如面部增加了AR投影仪,机器马的骨骼和表皮,也应用了更柔软的材料,骨骼材料也是轻量化设计。
这一部分的介绍很短,不过何小鹏也在最后留下彩蛋——一个蒙着布的机器马。
希望明年布揭开能看见真东西。
相比之下,飞行汽车这一趴,好歹看见了真的验证车。不过与此前的双翼螺旋桨结构不同的是,最新的样车以四翼螺旋桨的面貌出现,何小鹏表示,这种设计基于飞行稳定性的考量。
同时从放出的量产建模视频来看,四翼螺旋桨应该会保留到将来的量产车上,同时量产车将同时具备陆行和飞行两种行进方式。
这个静止状态,有点像一辆机甲化的小鹏P7背着一堆旅行箱:
虽然目前还在验证阶段,但何小鹏依然自信,小鹏汇天的飞行汽车,将是全球首款能飞又能开的飞行汽车。
期待吃饼~
8月13日,2025款的极氪001和极氪007正式上市。这两款新车官方起售价分别为25.90万元和20.99万元。2025款极氪001与极氪007,搭载了极氪智能科技最新的技术成果。全栈自研的第二代金砖电池,最大充电倍率高达5.5C,从10%充至80%仅需10分半钟,超越了传统三元锂电池。同时,极氪OS智能座舱系统也迎来了全面升级,正式更名为极氪AI OS,Eva进化为AI Eva。在智能驾驶领域,极氪全栈自研的浩瀚智驾系统迈入2.0时代,启动了端到端大模型的应用,优先实现了泊车和路口场景的端到端进化。此外,极氪还率先推出了城市NZP通勤模式,未来将逐步开通城市NZP和城市NZP+,最终实现从车位到车位的全场景城市智能驾驶体验。在智能驾驶方面,2025款极氪001同样带来了升级,首发搭载的浩瀚智驾2.0系统,基于激光雷达和双OrinX智驾芯片的智能硬件方案,实现了系统底层能力和用户体验的全面升级。基于全场景的端到端泊车能力,浩瀚智驾2.0的泊车时间最快可缩短至23秒,且泊车手法更加类人化。同时,该系统还带来了记忆泊车功能,用户只需一次记忆即可实现不限楼层、不限车位的自动泊车服务。
8月1日,昊铂SSR海外版正式下线,标志着中国超跑可以实现批量出海,树立全球造车科技新高度。超跑,被誉为“汽车工业皇冠上的明珠”,昊铂SSR的量产,不仅实现了打破西方对超跑的技术垄断,同时实现了对外输出超跑的产品、技术、文化和高端品牌的出海,实现了中国汽车工业新的飞跃。昊铂SSR去年10月正式上市以来,以超跑为载体,从研发、设计、试制试验、智造、产业链等,全方位提升中国汽车工业能力,也为中国汽车运动文化注入新力量,促进中国体育文化发展,也推动汽车文化的普及,助力中国从汽车大国迈向汽车强国。昊铂秉持低调务实、保持热诚的作风,征服了全球最顶尖的同行。汽车设计领域的璀璨明星Pontus Fontaeus,因其与法拉利、布加迪和兰博基尼等豪华车品牌的卓越合作而赫赫有名。如今,这位设计巨匠选择与昊铂携手,亲手打造出昊铂SSR这件璀璨的艺术品。伴随着昊铂全球化战略,凝结了中国工业最高技术水准的昊铂SSR,来到了全球用户的面前。去年昊铂SSR海外首秀,在国际舞台上也得到了超跑爱好者的喜爱。在泰国车展,昊铂SSR创下中国汽车出口史上“最高单价”的记录。(未来汽车日报)
7月29日,吉利对一块历经921次充放电(约40万公里行驶里程)的神盾短刀电池包进行了容量检测,结果显示健康度仍然高达90.5%。而同级产品搭载的电池包,在完成500次充放电之后,健康度就衰减到了80%,寿命远低于神盾短刀电池包。 同时,吉利还对一辆行驶里程超30万公里的银河E5耐久测试车进行了电池包拆解。拆解结果显示电池包的结构依然完整、防护完好。 8月3日,搭载神盾短刀电池的银河E5即将全球上市,并实现上市即交付。(未来汽车日报)
7月25日,比亚迪王朝全新中级SUV宋L DM-i在开封上市,新车基于新技术、新平台、新标准打造,百公里亏电油耗低至3.9L,满油满电综合续航超1500km,以“大宋”之名开创SUV油耗3时代,颠覆用户对中级SUV的油耗续航认知。宋L DM-i此次推出纯电续航里程75KM、112KM和160KM三个版本,共5款车型,售价13.58万-17.58万元。极致低能耗带来超长续航,宋L DM-i满油满电综合续航达1500km,宋L DM-i基于新一代插混整车平台打造,引领中级SUV向更优越驾乘空间和更高级驾乘体验进化。新车长宽高分别为:4780*1898*1670毫米,轴距达2782毫米,比途观L Pro(4735*1842*1682毫米)更长更宽,带来更宽奢的空间体验。纯平后排地板、超宽横向空间,让后排中座成为“C位”,加上宽舒云感座椅,带来前排头等舱、后排大沙发的舒适出行体验。超大后备箱可轻松放下全家行李,更可纯平放倒变身双人床,不管全家购物还是惬意露营,都能轻松满足。(未来汽车日报)
7月26日消息,7月25日,深蓝汽车全球战略车型“深蓝S07”正式上市,共推出增程加纯电10款配置车型,售价区间14.99万元-21.29万元,同时全系车型限时优惠1万元,其中215Max增程版、215Max乾崑智驾ADS SE版、215Pro增程版为深蓝S7经典再升级版本。深蓝S07左手深蓝超级增程,右手华为乾崑智能,在20万级中型SUV市场,携20大同级首发、50大同级领先的科技配置,打造同级领先科技含金量。随着的深蓝S07上市,意味着智能驾驶技术步入普及化新阶段,不仅满足了用户的智驾需求,也重新定义了智驾体验的价值感。华为乾崑智驾采用主视觉方案,与特斯拉纯视觉逻辑相同,在决策和规划时更加类人化,行驶轨迹更接近人类驾驶,拥有更高通行效率。但在华为乾崑智驾背后,有华为大数据模型为支撑,这一点与特斯拉纯视觉方案截然不同,实现了对驾驶环境的全方位感知和精准决策。同时,大数据模型还具备强大的学习和迭代能力,能够不断优化算法模型,提升驾驶辅助的精度和安全性。特斯拉在复杂场景下的理解能力和决策精度上,往往难以与华为乾崑智驾相媲美,这也是深蓝S07比肩特斯拉的底气。(未来汽车日报)