详解华为智驾的“灵魂减配”
卡门精选2023-12-04
大公司新造车行业
智界S7“灵魂减配”?10分钟看懂华为智驾方案的几次迭代。

本文来自微信公众号“汽车像素”(ID:autopix),作者:张家磊,编辑:冒诗阳,36氪Auto经授权发布。

11月28日,智界S7正式上市。作为华为与奇瑞合作的首款车型,从诞生之初便引起了不小的关注。值得注意的是,这款车与问界M5、M7一样,都只装配了一颗激光雷达。 

在高端车型上将激光雷达数量减少至一颗,说明在华为的智驾方案中,单激光雷达已然足够。从2022年首次有合作车型上市以来,华为智驾方案的激光雷达数量从三颗逐步减少至目前的单颗。与此同时,华为智驾方案也经历了从ADS 1.0到ADS 2.0的演变。 

华为的选择,是智能驾驶终于走出堆料时代的一个缩影。本文详解华为的智驾方案,以及GOD网络可能的技术原理。硬件方案上“灵魂减配”的背后,华为智能驾驶同样面对传感器融合的难题,尤其以激光雷达和摄像头的融合挑战最大。 

11月26日,华为智能驾驶核心业务将建立合资公司的方式曲线实现“独立”,那么ADS 2.0方案,真的成熟到可以独自成长的地步了吗? 

01.

华为智驾硬件的两次“减配”

从华为智驾到鸿蒙智行,华为的智驾方案经历过从 ADS 1.0 到如今ADS2.0的演变。1.0时代,智能驾驶的未来路线还不太清晰,从各种传感器到高精地图,华为可以说把能想到的都用上了。

比如在2022年4月首次合作推出的极狐阿尔法S HI版上,这款车配备了三颗激光雷达,相似的硬件配置方案,也用在了同年8月推出的阿维塔11上。

智驾硬件上的堆料,直接推高了车的终端售价,两款车最终定价都触及了40万元的高位。但智驾堆料堆出了高定价,堆出了汽车品牌追求的高端产品,却没有为智能驾驶用户体验的落地铺出路来。

包括华为在内的智能驾驶研发团队一直没有解决的一个问题是,这些五花八门的传感器之间,所面临的“语言不通”障碍。

多传感器的融合是十分困难的,其中最有代表性的就是激光雷达和摄像头的融合。前者提供点云信息,后者直接给出图像信息。

激光雷达的工作原理是这样的:通过发射脉冲光束,测量光束触碰周围物体后所反射回来的时间,由此来计算被测物体的距离。它的好处是精准和适应性强,可以达到毫米级的测距精度。可以在各种环境中使用,包括光照强烈和恶劣天气。

虽然可以准确的感知周边环境的三维信息,但激光雷达只能提供稀疏特征数据,行业里称之为“点云信息”。而摄像头却能直接采集出图像信息,提供给系统算法,自动分析图像并识别出其中的各种物体,由此来更精准的做出驾驶决策。

▍激光雷达与摄像头的差异

也就是说,激光雷达虽然精准可靠,但无法单独支撑智能驾驶功能的迭代。如果华为不想向特斯拉一样走向纯视觉的方案,多传感器之间的融合,是必须解决的问题。

如何做好传感器之间的融合一直是个难点。目前行业中探索的主流融合方式之一,称为点级,这套方案,需要将激光雷达和摄像头在车上的位置,进行高质量校准,极其精密的对齐,才能让两者的内容完全重合,如此来实现两组传感器的之间的“硬关联”。

但这是一套脆弱的融合方式,如果车辆行驶中产生的颠簸,让传感器发生轻微的位移,那很小的误差也会造成对齐失败。

此外,这种融合方案会浪费很多数据。比如激光雷达所采集到的稀疏矩阵数据,在与摄像头这种稠密矩阵数据进行融合的时候,会浪费大量具有丰富语义信息的图像特征。另外在图像特征质量比较低的时候,性能会大幅度下降。

今年4月16日,华为发布了自己的BEV+Transformer+GOD方案,为如今华为更成熟的ADS2.0方案打下了基础。与特斯拉的纯视觉不同的是,华为在传感器硬件上,依然保留了一颗激光雷达,采用的是多传感器融合的方式。那在这个方案之中,华为是如何解决激光雷达和摄像头的融合问题呢?

对于GOD技术的细节,华为没有做特别详尽的解释。但我们在2022年华为与香港科技大学、香港城市大学发布的这篇论文里,可以看到华为解决激光雷达和摄像头融合问题的一些可能的方式。

首先通过激光雷达的点云数据,初步获得行车环境的特征图,再基于特征图,用Transformer结构的解码器,预测一个初始边界框,大概的将行车环境中,所需要注意的物体框选、标注出来,得到含有距离信息的边界框。

到这一步,系统仍然处理的是激光雷达所采集到的信息,处理完激光雷达的信息后,系统会将这些信息投影到摄像头采集到的图像上,把2D图像的特征融合进去,给边界框赋予语义信息。

这里面很重要的一个工具,是大模型Transformer,它能够自适应地寻找2D图像与3D点云的关联。对硬件的对齐要求也没那么高了。

通过Transformer,华为可以让雷达和摄像头,两个传感器之间的硬关联,变成了软关联。这样就可以得到一个包含详细距离信息,系统又能看得懂的感知数据了。

为了提高对小物体检测的稳健性,系统再次导入整个高分辨率的图像。通过Transformer中的交叉注意机制,以一种稀疏到密集的、自适应的方式将2D图像再次融合。使得系统能够自适应地确定,应该从图像中获取哪些信息,包括信息的位置和性质。来对之前的边界框进行增强,让小物体的识别更加精准。

解决了传感器融合的问题后,华为就能让GOD网络获取更加丰富的感知数据,能帮助神经网络模型更好地感知和理解车辆周围环境。再通过GOD网络自主学习,构建3D世界模型。

02.

激光雷达的取舍

华为为什么要大费周章的建立GOD网络,而不是像特斯拉一样,采用一套纯视觉的智能驾驶方案呢?

事实上,华为乃至整个智能驾驶行业,都没有停止对特斯拉的学习。

2021年,特斯拉FSD Beta开始采用了一套基于BEV+Transformer的智能驾驶方案,BEV即鸟瞰图,它就像是为智能驾驶打开了一个从空中俯视上帝视角,让车辆能够把近处的感知统一放到一个平面中。

特斯拉的方案,为华为和其他埋头苦干的智驾公司,提供了另一种思路,华为在ADS1.0时代,也采用了这项组合技术。

但BEV框架还是不能解决所有问题,智驾系统需要先识别面前的是什么物体,才能做出相应的决策。如何识别前方物体呢,就需要依靠大量的系统训练,将一个个识别成功的物体,放进智驾系统所建立的“白名单”中。

可是“白名单”不足以覆盖实际交通环境中出现的海量障碍物类型,真正复杂的交通场景下,白名单永远都填不满。另外,感知系统只能识别到之前见过的物体,而没有办法识别一些异形的物体。

▍BEV视角下的点云信息

这项技术有一个硬伤,就是鸟瞰图是一套只有横纵坐标的二维图像,无法在Z轴上,感知到高度信息。

也就是说,特斯拉的这套方案可以让姗姗学步的智能驾驶走起路来,却还是不能保障走路时不摔倒。

特斯拉很快找到了自己的解决方法。2022年的特斯拉AI Day上,OCC占用网络被引入,它通过大量的分析和训练,将多个摄像头提供的2D图像信息,在3D空间中还原。用无数个小体块来展现现实世界。

但到这一步,国内智能驾驶方案商却跟不上了。实际上,纯视觉FSD真正的难点在于海量的驾驶数据,除了采集数据,更需要一个强大的模型,来对智能驾驶方案进行训练。

特斯拉自研芯片和Dojo模型,外购GPU将云端算力堆到10 Exa-flops,就是为了处理大量的传感器数据,并进行深度学习和模型训练。

如果国内智能驾驶方案商贸然模仿,自家智能驾驶技术进步速度,可能永远也追不上特斯拉,华为不甘心只当一个追随者。

原本国内的新势力们解决这个问题的方式是依赖高精地图。在发现高精地图因为成本和更新不及时的问题,而无法长久应用后,大家纷纷开始研发自己的方案,华为就是其中之一。

华为所建立的多传感器融合方案,就是为了避开特斯拉OCC花在将2D图像还原成3D,所需要的那部分复杂计算。通过加上一颗激光雷达,提供更加详细的距离信息,华为降低了数据分析的难度,对云端算力的需求也相应降低。

此外,在国内复杂的城区路况下,对近距离测距的精准度要求更高,比测试场地中更棘手的case多很多。这颗激光雷达就可以对前方障碍物进行详细测距,再与摄像头的数据精准匹配,得到更为准确的数据。并且在暗光、大光比、雨雾天气这种摄像头识别不那么准确的时候,也可以稳定输出感知数据。

虽然眼下华为保留单激光雷达的方案,在装车的硬件成本上,仍然会高于只有摄像头的纯视觉方案,但研发投入、时间周期,也是需要被计算的成本。

如今,在华为智驾方案不断迭代的途中,特斯拉的纯视觉方案FSD已经很久没有披露出进展了。也许,融合激光雷达的智驾路线,“总成本”更低。

▍智界S7上市

智能驾驶方案迭代到现在,算法已经不是各家竞争的焦点。在数据量不足的时候,面对不同城市的复杂路段,难免出现漏洞。如何快速获取行驶数据,并在短时间内将训练结果OTA到车辆,才是加快开城速度的关键。

从竞争者蔚小理的部署情况来看,也许明年,辅助驾驶的数据竞争赛,就要正式开始了。

与这几家企业一样,华为计划今年年底开通全国的无图城区智能驾驶,压力一点都不小。

按道理来说,辅助驾驶开通之前,车厂都应该用自己的车队跑一遍,给大模型的训练一个基础的数据。但全国都跑的话,需要耗费大量的时间和人力、算力。如果直接开通给用户,短时间内大量的数据涌入,也会让华为不堪重负。优先开通“通勤模式”,让各地的车主在同一路段反复跑,对大模型反复进行“自训练”,也许是比较稳妥的方式。

华为的融合方案,就单车的硬件和计算成本来说,肯定是有所增加的。融合算法必须证明自己在“总成本”上更具性价比,才有可能被大规模的铺开。多去路上收集实战数据持续训练AI,才能让车辆越“开”越聪明。

华为打算如何面对这些挑战,我们也只能拭目以待了。

该文观点仅代表作者本人,未来汽车日报系信息发布平台,未来汽车日报仅提供信息存储空间服务。
最新快讯
13.58万元起售,宋L DM-i正式上市
昨天

7月25日,比亚迪王朝全新中级SUV宋L DM-i在开封上市,新车基于新技术、新平台、新标准打造,百公里亏电油耗低至3.9L,满油满电综合续航超1500km,以“大宋”之名开创SUV油耗3时代,颠覆用户对中级SUV的油耗续航认知。宋L DM-i此次推出纯电续航里程75KM、112KM和160KM三个版本,共5款车型,售价13.58万-17.58万元。极致低能耗带来超长续航,宋L DM-i满油满电综合续航达1500km,宋L DM-i基于新一代插混整车平台打造,引领中级SUV向更优越驾乘空间和更高级驾乘体验进化。新车长宽高分别为:4780*1898*1670毫米,轴距达2782毫米,比途观L Pro(4735*1842*1682毫米)更长更宽,带来更宽奢的空间体验。纯平后排地板、超宽横向空间,让后排中座成为“C位”,加上宽舒云感座椅,带来前排头等舱、后排大沙发的舒适出行体验。超大后备箱可轻松放下全家行李,更可纯平放倒变身双人床,不管全家购物还是惬意露营,都能轻松满足。(未来汽车日报)

售价14.99万元-21.29万元,深蓝S07正式上市
昨天

7月26日消息,7月25日,深蓝汽车全球战略车型“深蓝S07”正式上市,共推出增程加纯电10款配置车型,售价区间14.99万元-21.29万元,同时全系车型限时优惠1万元,其中215Max增程版、215Max乾崑智驾ADS SE版、215Pro增程版为深蓝S7经典再升级版本。深蓝S07左手深蓝超级增程,右手华为乾崑智能,在20万级中型SUV市场,携20大同级首发、50大同级领先的科技配置,打造同级领先科技含金量。随着的深蓝S07上市,意味着智能驾驶技术步入普及化新阶段,不仅满足了用户的智驾需求,也重新定义了智驾体验的价值感。华为乾崑智驾采用主视觉方案,与特斯拉纯视觉逻辑相同,在决策和规划时更加类人化,行驶轨迹更接近人类驾驶,拥有更高通行效率。但在华为乾崑智驾背后,有华为大数据模型为支撑,这一点与特斯拉纯视觉方案截然不同,实现了对驾驶环境的全方位感知和精准决策。同时,大数据模型还具备强大的学习和迭代能力,能够不断优化算法模型,提升驾驶辅助的精度和安全性。特斯拉在复杂场景下的理解能力和决策精度上,往往难以与华为乾崑智驾相媲美,这也是深蓝S07比肩特斯拉的底气。(未来汽车日报)

智能可变硬实力+高端制造赋能,长安启源E07预测售价30—50万元
2024-07-23

月19日下午,全球首款基于SDA平台打造的智能可变新汽车(一车抵多车,出游变身“SUV形态”、通勤变身“轿跑形态”、装载变身“皮卡形态”)——长安启源 E07 携变形金刚在长安汽车数智工厂重磅亮相,长安数智工厂拥有国内首创的全自动化柔性无人化压铸生产车间,主要包含熔化、压铸、后处理、机加、装配五大工艺,拥有4台7700吨压铸机,长安启源E07采用的行业领先的前、后一体化压铸工艺,实现了将163个件集成为2个零件,铸件时间仅用110秒,首创一模两件的压铸工艺,可实现保险杠件和一体压铸件分开设计,通过机械结构缓连,保证汽车在常规碰撞中不伤一体铸件,减少碰撞后的维护费用;通过一体化压铸技术的应用,使长安启源E07整车重量降低20%,比Model X的整备质量轻100多公斤,操控更敏捷,响应更积极;同时扭转刚度提升24%,弯曲刚度提升23%,碰撞吸能效率提升54%,整车安全满足严苛的2024版C-NCAP五星安全标准。(未来汽车日报)

奇瑞SUV瑞虎8L开启预售,预售价14.77万元起
2024-07-18

7月17日,在2024奇瑞粉丝节上,奇瑞瑞虎8家族新旗舰瑞虎8L正式开启预售,预售价14.77万元起。瑞虎8L定位5+2 座智享大家庭 SUV,首先带来越级宽大的5+2座12种灵动空间,既保证了每个位置的宽敞舒适性,也能轻松装下钓具、天幕、滑雪板等户外装备,满足多种出行场景的装载需求。另外,瑞虎8L还拥有0重力一键舒躺女王副驾等一系列豪华配置,以及全面出众的NVH性能,用户可随时畅享极致舒适体验。动力方面,瑞虎8L搭载奇瑞自研的鲲鹏2.0T发动机,配搭奇瑞自研的孚祯8AT,新车百公里加速达到8秒级。与此同时,瑞虎8L配备全场景智控四驱,除了3种基础驾驶模式外,还提供4种越野模式,无论是泥泞、沙地还是雪地,都能通过强大的四驱系统,带来媲美硬派越野的全场景通过性,满足用户偶尔下道露营的需求。用户在预售期间交2000元大订,可抵10000元购车款,让利力度十足。与此同时,用户可享8.8元小订抽奖(100%中奖)。对于大订用户,在丰厚购车款的基础上,还可获赠3000元露营套装,并可至高享15000元置换补贴。此外,预售期间订车用户,可享整车终身质保(首任车主)。(未来汽车日报)

联手商汤AI大模型 “空间王者”L380亮相世界人工智能大会
2024-07-08

7月4日,2024世界人工智能大会(WAIC)在上海世博展览馆拉开帷幕。大会战略合作伙伴商汤科技在7月5日主办的“大爱无疆·向新力”论坛上发布对标GPT-4o 的“SenseNova 5.5”大模型体系。而作为首个搭载商汤“SenseNova”AI大模型的汽车产品,LEVC旗下豪华纯电MPV——“空间王者”L380也亮相WAIC。除此之外,LEVC联席CTO于童也出席上述论坛并作主题演讲,详解L380如何开启轮上空间新纪元。于童表示,“基于行业第一的空间利用率和空间灵活性,L380已经成为能够激发AI大模型无限潜能的智能底座。而在未来,AI大模型也将赋能智能汽车完成更全面的智能体验升级。”LEVC起源于1908年,在百年历史长河中始终聚焦高端商务出行,为全球超过10亿人次提供宽敞舒适、优雅的出行体验,成为全球出行领域的领军者与文化名片。而随着吉利在2006年的股权收购以及2013年的全资收购,LEVC最终成为吉利全球化战略布局中的重要一环,并开启全新征程。(36氪AUTO)

查看更多快讯
最新要闻
广汽埃安第二代AION V上市,直指全球市场
售价区间12.98万-18.98万元。
23小时前
2024第二届智能座舱车载显示与感知大会
2024年7月12日,由盖世汽车主办的2024第二届智能座舱车载显示与感知大会在上海圆满落幕!论坛为期两天,线上线下同步进行。
2024-07-18
2024汽车数字钥匙技术论坛
​2024年7月10日,盖世汽车2024汽车数字钥匙技术论坛在上海圆满落幕!
2024-07-18
上半年销量突破133.4万辆,长安汽车储备竞争粮草
阿维塔品牌下半年将推出增程产品。
2024-07-10
顶配售价不超20万,零跑C16能否打开新的增长点?
以性价比抢占市场。
2024-07-08
试驾翼真L380:用“大空间”破局
官方指导价37.99万元-47.99万元。
2024-07-05