大模型画的饼,自动驾驶能消化么?
卡门精选2023-07-11
自动驾驶行业
当模型参数量超过某个临界值之后,它的性能会大大超越预期。

本文来自微信公众号“AutoReport 汽车产经”(ID:autoreport),作者:Misfire,编辑:于杰,36氪Auto经授权发布。

如果要评选2023年最大的风口,AI大模型一定位列其中。 

风起自ChatGPT的现象级爆火,英伟达创始人黄仁勋激动地喊出了“AI的iPhone时刻正在到来“。 

整个科技圈似乎达成了一种共识:所有产品都值得用大模型重做一遍,当然也包括正处于寒冬之中的自动驾驶。

然后,几乎是一夜之间,整个汽车圈都是GPT上车的消息,长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等搭上了百度的文心一言。 

“蔚、小、理“先后申请了GPT的相关商标。其中,理想自研的Mind GPT已经正式发布。另外,毫末智行也在不久前发布了自动驾驶生成式大模型drive GPT。 

可以说AI大模型的火热,给正在冷却中的自动驾驶又画了一张新的大饼。 

有人表示从中看到了自动驾驶的未来。比如集度汽车创始人夏一平,小鹏汽车董事长何小鹏等,当然也有很多人觉得,GPT上车目前就是个PR行为。 

所以,今天来尝试探讨一个问题,大模型之于自动驾驶,到底有什么作用?它能给这个已经烧掉无数金钱但依然成效寥寥的赛道,带来一个相对确定的未来么? 

不可解释的“涌现”和自动驾驶的困境

先明确一个定义,大模型是指具有超大参数规模(通常在十亿个以上)和复杂程度的机器学习模型。通常来说,参数量越大,模型就越容易拟合海量数据的规律。 

而ChatGPT的出现,让人们有一个非常惊喜的发现。那就是 当模型参数量达到了一定程度,超过某个临界值之后,它的性能会大大超越预期。

很多科学家惊叹于这一现象,并将其称之为“涌现“。但遗憾的是到目前为止还没有一套系统、公认的理论来解释为什么会出现这个现象。 

所以我们姑且相对简单地把这种“涌现“理解为一个从量变到质变的过程。在跨过临界点之后,模型精度呈指数型增加,甚至产生了类似于人类的逻辑思考能力。 

而这种能力很可能是自动驾驶算法攻克最后1%长尾场景的关键所在。 在数据标注、虚拟仿真环境以及决策规划上,大模型都有可能改变甚至重写过去的算法。

举个例子,低频率但又几乎不可穷尽的Corner Case,正是从高阶辅助驾驶迈向自动驾驶最大的一块绊脚石。 

而Corner Case的出现带有极强的不可预知性,毫末智行数据智能科学家贺翔举了一个例子,一辆卡车转运一颗大树,算法看到的可能只有车,而没有伸出车外的树枝。 

类似的状况有很多,比如说很特别的大件运输车辆,甚至是违规拉着很长一根管子的三轮车。 

面对这些场景,算法只识别的车辆是不够的,但按照现在基于标签的方式来挖掘长尾场景,只能给系统看大量的标注图片,教它学会识别。 

不过问题在于,这些车辆出现的频率太低,数据采集的难度大、成本高、周期长,真正碰到这种场景的概率又小,成本上是算不过来的。 

但AI大模型具备举一反三的能力,我们可以 通过文字的描述来使其检索并对图像进行分类,检索甚至是自主创造我们需要的长尾场景, 例如拖着大树的卡车,拉着长水管的三轮车等。 

除此之外,大模型也可以更好的从数据中提取特征,进行数据标注。 

比如,先用海量未标注数据通过自监督的方式预训练一个大模型,然后用少量已经人工标注好的数据对模型做微调,使得模型具备检测能力,这样模型就可以自动标注需要的数据。 

目前,很多公司都在研究如何提高大模型自动标注的精度,希望实现自动标注的完全无人化。 

在Mind GPT发布之后,理想汽车董事长李想就表示:“我们一年要做大概1000万帧的自动驾驶图像的人工标定,外包公司价格大概6元到8元钱一张,一年成本接近一亿元。 当我们使用大模型,通过训练的方式进行自动化标定,过去需要用一年做的事情基本上3个小时就能完成,效率是人的1000倍。 ” 

总之,自动驾驶的感知也好,规划决策也好,目前基本上是基于经验和规则的,缺少场景泛化的能力。 

但就像夏一平所言,大模型解决的正是泛化的问题,是举一反三的问题,这可能让自动驾驶在未来3-5年内又重大的突破。 

因为从根本上来说,生成式AI在语言模型上的应用思路是可以平移到自动驾驶上的。 

虽然计算机不懂自然语言,但它通过数学建模,把语言问题变成了数学问题。通过给定文本的历史,预测下一个词出现的概率,间接地理解了自然语言。 

换到驾驶场景,如果给定当前的交通环境,给定一个导航地图,以及一个驾驶员驾驶行为的历史,那么,大模型是不是可以预测下一个驾驶动作? 

理论上,这是可行的。地平线的创始人余凯认为以AI现在所展现的学习能力,学习司机的驾驶习惯并不难。 

“接下来要继续用更大的数据、更大的模型,无监督地去学习人类驾驶的尝试,就像我们从大量无监督的、没有标注的自然文本里去学习一样,构建一个回归自动驾驶的大语言模型。” 

吃饼还需算力硬

大模型为自动驾驶画出来的这张饼,很诱人。但能不能消化其实是另外一回事儿。 

“现在说GPT上车都是噱头,车端还没有运转大模型的硬件条件。” 贺翔说道。 

理论上,大模型需要高规格的硬件配置,包含高性能计算能力、大容量内存和低时延等特点,但车载设备的硬件条件相对有限,无法提供足够的计算资源支撑大模型运行。 

举个例子,在自然语言处理领域的 GPT-3 模型就需要数万亿Tops的计算能力。这要求芯片的算力至少要在万级Tops以上才能够胜任大型模型的计算任务。 

但是,在车载部署场景下,芯片的算力往往只有数百Tops,远远达不到大型模型的要求。 

所以,目前自动驾驶大模型也只能暂时运转在云端,例如毫末智行的Drive GPT。 

但即便如此,它依然可以对车端产生影响。 比如通过用知识蒸馏的方式“教”车端的小模型。 

最简单的方式就是把需要打标签的图片给大模型学习,大模型可以给这些图片打好标签,标注好的图片就可以用于小模型的训练。 

所以,大模型对算力的消耗让云计算厂商成为了第一批被风吹起来的玩家。 

2023年以来 阿里、美团、腾讯等互联网大厂也都纷纷收缩或者调整了自动驾驶相关的投入,将更多的精力放到了云计算和AI大模型上。 

而主机厂这边,自建超算中心也逐渐成为了基本操作。 

当然如果大模型只能运转在云端,它对于自动驾驶的影响会小很多。因为从云端到车端,哪怕只是一点点的时延也可能会在公路上造成悲剧。 

所以目前地平线、英伟达等芯片企业都在积极研发适应大模型上车需求的新一代高算力AI芯片。 

地平线CTO黄畅认为,按照发展进程来看, 在自动驾驶场景中,大模型在车端会优先从环境模型的预测和交互式规控和规划开始应用。

“这个场景不需要特别的大规模参数模型,在百Tops级别的算力平台上就能应用, 3~5年内就可以初步上线。” 

“但如果从感知到定位地图到规控,整个端到端的闭环做出来,则需要一个更大规模的参数模型,大概需要5~10年的时间。”黄畅补充到。 

写在最后

严格来说,一夜火遍全球的ChatGPT只是AI大模型中的一种。自动驾驶行业对于大模型的运用比ChatGPT的爆火要早很多。

2017年,马斯克从Open AI挖来了了一位计算机视觉领域的顶级研究院Andrej Karpathy。

他在特斯拉工作了五年,最高做到了AI高级总监兼自动驾驶负责人,而这五年也被绝大多数人认为是特斯拉自动驾驶成长最快的五年。

入职后不久,Andrej Karpathy就重写了特斯拉自动驾驶算法,以BEV纯视觉感知+Transformer为基础,将特斯拉的智能驾驶带入了新的阶段。

当下小鹏、华为、毫末智行、理想等企业正在纷纷跟进这一路线。

而所谓Transformer是一种由谷歌8为AI科学家提出的一种深度学习神经网络,GPT中的T正是指代Transformer。

Open AI将Transformer运用于自然语义理解,诞生了ChatGPT;特斯拉将其应用于计算机视觉,成功开创了BEV技术,让纯视觉感知成为了潮流。

接下来,Transformer还将被自动驾驶玩家们逐步运用到决策规划等各个环节,改变现有模块化的部署方式,迈向端到端的自动驾驶。

我们现在还无法预知这一切会擦出怎么样的火花,但可以肯定大模型在智能驾驶上还未达到自然语义一般“涌现”的程度。

芯片算力、数据来源以及丰富程度甚至是车辆的散热性能,都还没有准备好迎接大模型的上车。

但至少,改变已经在发生,也许这一次自动驾驶这条路也许就真的通了呢?

该文观点仅代表作者本人,未来汽车日报系信息发布平台,未来汽车日报仅提供信息存储空间服务。
最新快讯
2025款极氪001和007上市,新增端到端大模型应用
2024-08-20

8月13日,2025款的极氪001和极氪007正式上市。这两款新车官方起售价分别为25.90万元和20.99万元。2025款极氪001与极氪007,搭载了极氪智能科技最新的技术成果。全栈自研的第二代金砖电池,最大充电倍率高达5.5C,从10%充至80%仅需10分半钟,超越了传统三元锂电池。同时,极氪OS智能座舱系统也迎来了全面升级,正式更名为极氪AI OS,Eva进化为AI Eva。在智能驾驶领域,极氪全栈自研的浩瀚智驾系统迈入2.0时代,启动了端到端大模型的应用,优先实现了泊车和路口场景的端到端进化。此外,极氪还率先推出了城市NZP通勤模式,未来将逐步开通城市NZP和城市NZP+,最终实现从车位到车位的全场景城市智能驾驶体验。在智能驾驶方面,2025款极氪001同样带来了升级,首发搭载的浩瀚智驾2.0系统,基于激光雷达和双OrinX智驾芯片的智能硬件方案,实现了系统底层能力和用户体验的全面升级。基于全场景的端到端泊车能力,浩瀚智驾2.0的泊车时间最快可缩短至23秒,且泊车手法更加类人化。同时,该系统还带来了记忆泊车功能,用户只需一次记忆即可实现不限楼层、不限车位的自动泊车服务。

中国超跑首次批量出海,昊铂SSR海外版正式下线
2024-08-02

8月1日,昊铂SSR海外版正式下线,标志着中国超跑可以实现批量出海,树立全球造车科技新高度。超跑,被誉为“汽车工业皇冠上的明珠”,昊铂SSR的量产,不仅实现了打破西方对超跑的技术垄断,同时实现了对外输出超跑的产品、技术、文化和高端品牌的出海,实现了中国汽车工业新的飞跃。昊铂SSR去年10月正式上市以来,以超跑为载体,从研发、设计、试制试验、智造、产业链等,全方位提升中国汽车工业能力,也为中国汽车运动文化注入新力量,促进中国体育文化发展,也推动汽车文化的普及,助力中国从汽车大国迈向汽车强国。昊铂秉持低调务实、保持热诚的作风,征服了全球最顶尖的同行。汽车设计领域的璀璨明星Pontus Fontaeus,因其与法拉利、布加迪和兰博基尼等豪华车品牌的卓越合作而赫赫有名。如今,这位设计巨匠选择与昊铂携手,亲手打造出昊铂SSR这件璀璨的艺术品。伴随着昊铂全球化战略,凝结了中国工业最高技术水准的昊铂SSR,来到了全球用户的面前。去年昊铂SSR海外首秀,在国际舞台上也得到了超跑爱好者的喜爱。在泰国车展,昊铂SSR创下中国汽车出口史上“最高单价”的记录。(未来汽车日报)

40万公里神盾短刀电池健康度达90.5%
2024-07-29

7月29日,吉利对一块历经921次充放电(约40万公里行驶里程)的神盾短刀电池包进行了容量检测,结果显示健康度仍然高达90.5%。而同级产品搭载的电池包,在完成500次充放电之后,健康度就衰减到了80%,寿命远低于神盾短刀电池包。 同时,吉利还对一辆行驶里程超30万公里的银河E5耐久测试车进行了电池包拆解。拆解结果显示电池包的结构依然完整、防护完好。 8月3日,搭载神盾短刀电池的银河E5即将全球上市,并实现上市即交付。(未来汽车日报)

13.58万元起售,宋L DM-i正式上市
2024-07-26

7月25日,比亚迪王朝全新中级SUV宋L DM-i在开封上市,新车基于新技术、新平台、新标准打造,百公里亏电油耗低至3.9L,满油满电综合续航超1500km,以“大宋”之名开创SUV油耗3时代,颠覆用户对中级SUV的油耗续航认知。宋L DM-i此次推出纯电续航里程75KM、112KM和160KM三个版本,共5款车型,售价13.58万-17.58万元。极致低能耗带来超长续航,宋L DM-i满油满电综合续航达1500km,宋L DM-i基于新一代插混整车平台打造,引领中级SUV向更优越驾乘空间和更高级驾乘体验进化。新车长宽高分别为:4780*1898*1670毫米,轴距达2782毫米,比途观L Pro(4735*1842*1682毫米)更长更宽,带来更宽奢的空间体验。纯平后排地板、超宽横向空间,让后排中座成为“C位”,加上宽舒云感座椅,带来前排头等舱、后排大沙发的舒适出行体验。超大后备箱可轻松放下全家行李,更可纯平放倒变身双人床,不管全家购物还是惬意露营,都能轻松满足。(未来汽车日报)

售价14.99万元-21.29万元,深蓝S07正式上市
2024-07-26

7月26日消息,7月25日,深蓝汽车全球战略车型“深蓝S07”正式上市,共推出增程加纯电10款配置车型,售价区间14.99万元-21.29万元,同时全系车型限时优惠1万元,其中215Max增程版、215Max乾崑智驾ADS SE版、215Pro增程版为深蓝S7经典再升级版本。深蓝S07左手深蓝超级增程,右手华为乾崑智能,在20万级中型SUV市场,携20大同级首发、50大同级领先的科技配置,打造同级领先科技含金量。随着的深蓝S07上市,意味着智能驾驶技术步入普及化新阶段,不仅满足了用户的智驾需求,也重新定义了智驾体验的价值感。华为乾崑智驾采用主视觉方案,与特斯拉纯视觉逻辑相同,在决策和规划时更加类人化,行驶轨迹更接近人类驾驶,拥有更高通行效率。但在华为乾崑智驾背后,有华为大数据模型为支撑,这一点与特斯拉纯视觉方案截然不同,实现了对驾驶环境的全方位感知和精准决策。同时,大数据模型还具备强大的学习和迭代能力,能够不断优化算法模型,提升驾驶辅助的精度和安全性。特斯拉在复杂场景下的理解能力和决策精度上,往往难以与华为乾崑智驾相媲美,这也是深蓝S07比肩特斯拉的底气。(未来汽车日报)

查看更多快讯
最新要闻
广汽埃安第二代AION V上市,直指全球市场
售价区间12.98万-18.98万元。
2024-07-26
2024第二届智能座舱车载显示与感知大会
2024年7月12日,由盖世汽车主办的2024第二届智能座舱车载显示与感知大会在上海圆满落幕!论坛为期两天,线上线下同步进行。
2024-07-18
2024汽车数字钥匙技术论坛
​2024年7月10日,盖世汽车2024汽车数字钥匙技术论坛在上海圆满落幕!
2024-07-18
上半年销量突破133.4万辆,长安汽车储备竞争粮草
阿维塔品牌下半年将推出增程产品。
2024-07-10
顶配售价不超20万,零跑C16能否打开新的增长点?
以性价比抢占市场。
2024-07-08
试驾翼真L380:用“大空间”破局
官方指导价37.99万元-47.99万元。
2024-07-05