本文来自微信公众号“42号车库”(ID:i42how),作者:阿凡达,未来汽车日报经授权发布。
AI Day 3 个小时的直播里,其中半个小时只有音乐没有画面。当然,这是特斯拉,这是马斯克,发布会迟到这种事情,我们也预料到了。
而后面的两个半小时,都是关于 FSD、Dojo 以及 Tesla Bot 机器人和深度 Q&A 的内容。
如果一定要问我其中记住了什么,我心里好像只有一个栩栩如生的画面。在 AI Day 直播开始后的 2 小时 53 分处,马斯克风骚地撩开夹克并回应记者的提问,说道:
If you wear a T-shirt with a stop sign, the car will stop.
他说的意思就是,如果你穿着下面这种指令停车的路牌的衣服,特斯拉也会识别成真实的路牌并且停车。
从这句话里,结合最近的某品牌的车祸和 AI Day 的演讲内容,我总结了两个含义。
现阶段所有市面上普通人能买来开上路的「自动驾驶」其实都是辅助驾驶。自己的命只能自己负责,这一点不能忘。
人脑强在语义信息的识别,而电脑强在精确且重复的计算和目标跟踪。
想必大部分的朋友们已经知道,特斯拉现在采用的是纯视觉感知方案。只依靠 8 个 130 万像素摄像头的感知能力,确实提升到了一个新的境界。传统的感知算法是把这 8 个摄像头的里的每一帧图片中的相关物体逐个画上边框,来评估距离信息并依此输出规控结果。
但是目前全新的 FSD beta 采用了叫做「Vector Space(矢量空间)」的技术,相当于通过把 8 个视频流中缝合成一个整体,并生成一个统一的物理模型作为路线规划的基础。如果要我说人话,就是特斯拉在车里做了一个可以模拟现实环境的沙盘,然后在这里面推演它的操作。
Vector Space 是 4D 的。所谓 4D 就是长宽高三个维度的立体信息加上时间。所以,这个沙盘是一个立体且有时间线的模型,远比传统的 2D 感知来的信息量和精度都高。
特斯拉 AI 总监 Andrej Karpathy 说:
We are developing a synthetic animal from the ground up.
其实这就是「自动化」和「智能化」的区别。FSD 想要做的就是脱离对特定画面因素有特定的反应的死模式,而是通过对整体空间和里面的物体的把握来做更符合「上下文」的判断。通过对时空的记忆,特斯拉 FSD 除了可以记住并预测被遮挡的行人,也可以更好地动态改变自己的绕行路线。
说实话,AI Day 的很多内容,对于我这种只想看最终结果的人来说,没太看懂。不过我发现他们对于自动驾驶的研发目标,其实也是体验驱动的。
按照第一性原理,车子的本质就是一个交通让人从 A 点到达 B 点的交通工具。而一个合格的搭载自动驾驶交通工具,还需要在确保能到达的基础上,优化效率、舒适性和安全性。
说人话就是,特斯拉想让你的旅途又快又稳又放心,也就是「顺滑」。
本次 AI Day 的规控部分由毕业于自动驾驶名门院校——美国卡内基梅隆大学的特斯拉自动驾驶元老级人物,也是 AP 的软件负责人 Ashok Elluswamy 担任主讲。
Elluswamy 说,路径规划的挑战有两个——非凸和高维度。
非凸就是下图中在右侧的函数,有多个局部极值,而不是像左边的凸函数那样只有一个极值。
这样的问题就适合用 Discrete Search (离散优化)而不是 Continuous Function Optimization 「连续优化」。前者类似带数字,而后者可以理解为用微分的方式找到极值。如果使用微分方程来解上图中右边的非凸函数,则有可能得出错误的答案。
高维度就意味着这个问题拥有许多参数,和非凸问题相反,它更适合连续优化。
其实每当遇到这些决策的时候,特斯拉可以在 1.5 毫秒内做出 2,500 次推演。相比人脑,这种场景对于电脑来说,其实都是静止的。
上图中,车辆需要在下一个路口左转前完成两次连续的向左变道。如果选择插入到相近的两台车之间,急促的刹车不可避免。但是如果为了避免车辆而加速到最前方,又会面临错过路口的风险。FSD 可以从图里的右侧的多个解答(每一根线都对应不同的动作指令)中选择加速度(和舒适性有关)较为稳定且路径(和效率有关)较短的结果来执行。
我们都不喜欢起冲突,其实机器也是。因为冲突意味着至少有一方会受到伤害,两败俱伤也不是少数。效率上的损失大到交通事故,小到交通堵塞。其实都是都是因为有大大小小的冲突导致的。
上图中的道路是一个居民区的双向车道,但是由于过多的路边停车导致局部道路只有一辆车的宽度。如果你是一个喜欢侥幸的司机,你可能会希望对方的车避让你;如果你是一个保守的司机,你可能会在空旷的位置停下,让对方先行。但是无论如何,你都需要预判对方的动作来给自己的决策做参考。不然你停在那里死等对方,对方也停在那里死等你,对于双方都非常保守的自动驾驶系统来说,这样就会陷入死循环。
这个时候,特斯拉的 FSD 算法其实会跟人一样,根据车速,加速度以及角速度和角加速度等因素判断对向来车的路径(绿色代表避让轨迹,但是可能性更低)。根据这个结果,自车会采取冲突概率更低的避让的策略。
就在此时,没想到对向来车也怂了。面对这种情况,自车会迅速对新局势做出响应,果断地切换到主动通过的策略。所以,为别车规划路线并不是浪费算力,而是为了减少冲突,提高效率。利他终究是利己的。
比如在停车场景下,不同的解题逻辑和算法会对路径的计算量产生极大的影响。
以下内容来自维基百科,对 A* 和蒙特卡洛树搜索这两种算法做出了解释。
A* 搜索
其中,A* 搜索算法(A* search algorithm)是一种在图形平面上,有多个节点的路径,求出最低通过成本的算法。游戏中 NPC(非玩家角色)的移动计算,或网络游戏的 BOT 的移动计算上。
蒙特卡洛树搜索
而谷歌 AlphaGo 也用的蒙特卡洛树搜索是一种用于某些决策过程的启发式搜索算法。它的每个循环包括四个步骤:
选择(Selection):从根节点 R 开始,连续向下选择子节点至叶子节点 L。下文将给出一种选择子节点的方法,让游戏树向最优的方向扩展,这是蒙特卡洛树搜索的精要所在。
扩展(Expansion):除非任意一方的输赢使得游戏在L结束,否则创建一个或多个子节点并选取其中一个节点C。
仿真(Simulation):在从节点 C 开始,用随机策略进行游戏,又称为 playout 或者 rollout。
反向传播(Backpropagation):使用随机游戏的结果,更新从C到R的路径上的节点信息。
*每一个节点的内容代表胜利次数/游戏次数
Elluswamy 表示,他们分别对比了 A* 搜索(欧几里得距离算法)、基于欧几里得距离算法+语义导航信息导航的 A* 搜索和基于神经元网络策略+价值方程的蒙特卡洛树搜索。
三种不同的算法策略下,分别产生了 398,320、22,224 和 288 次搜索才能找到进入车位的的合适路径。其中效率最高的就是 MCTS(蒙特卡洛树搜索)。
至于蒙特卡洛树搜索对于 AI 技术有什么样的重要性,我们看一看 AlphaGo 的迭代历史就知道了。最新版本 MuZero 除了可以玩的游戏种类(围棋、国际象棋、日本将棋和 Atari),还可以在完全蒙圈的情况下通过大量观察学习游戏的玩法和规则,从而击败人类玩家。这样的结果可以说是对 AI 能力泛化的未来给出了很大的想象空间,让机器具备学习能力的时代终将会来临。
其实特斯拉还没有开始使用上述的泊车策略。而上述很多功能也需要在 D1 芯片量产后 Dojo 真正落地的时候才能跑通。
但不可否认的一点是,就在大家还在挣扎用不用激光雷达和毫米波雷达的时候,纯视觉的特斯拉已经率先把这个战争从感知硬件推进到了感知算法和规控算法上,并在考虑如何更高效地利用用户产生的大量数据来训练自己的神经网络模型。
就在前不久, FSD Beta V10 发布了。在夜间的光线条件下零接管通过九曲花街,确实又是一个新的里程碑。
而在这个训练模型的过程中,不仅成为了真实自动驾驶数据回流最丰富的公司,也是目前唯一靠自己的研发能力搞定了自研壁垒更高的自动驾驶芯片和超算中心,当然这也是其产品销量足够高才能做到的。连激光雷达的量产都懒得等的特斯拉,虽然其 CEO 的嘴炮能力和出尔反尔也是一等一的存在,但是不管怎么说,特斯拉的确在自动驾驶技术的布局方面,是领先行业 2-3 年的存在。
会为了提高通过效率和对向来车博弈;会通过疯狂计算找出最顺滑最节能最安全的路径规划;可以通过摄像头输出的图像信息输出立体的沙盘空间;对周围的车辆和人物都有动态记忆的特斯拉,它离自动驾驶的距离可能比你想象得还要更近。
8月13日,2025款的极氪001和极氪007正式上市。这两款新车官方起售价分别为25.90万元和20.99万元。2025款极氪001与极氪007,搭载了极氪智能科技最新的技术成果。全栈自研的第二代金砖电池,最大充电倍率高达5.5C,从10%充至80%仅需10分半钟,超越了传统三元锂电池。同时,极氪OS智能座舱系统也迎来了全面升级,正式更名为极氪AI OS,Eva进化为AI Eva。在智能驾驶领域,极氪全栈自研的浩瀚智驾系统迈入2.0时代,启动了端到端大模型的应用,优先实现了泊车和路口场景的端到端进化。此外,极氪还率先推出了城市NZP通勤模式,未来将逐步开通城市NZP和城市NZP+,最终实现从车位到车位的全场景城市智能驾驶体验。在智能驾驶方面,2025款极氪001同样带来了升级,首发搭载的浩瀚智驾2.0系统,基于激光雷达和双OrinX智驾芯片的智能硬件方案,实现了系统底层能力和用户体验的全面升级。基于全场景的端到端泊车能力,浩瀚智驾2.0的泊车时间最快可缩短至23秒,且泊车手法更加类人化。同时,该系统还带来了记忆泊车功能,用户只需一次记忆即可实现不限楼层、不限车位的自动泊车服务。
8月1日,昊铂SSR海外版正式下线,标志着中国超跑可以实现批量出海,树立全球造车科技新高度。超跑,被誉为“汽车工业皇冠上的明珠”,昊铂SSR的量产,不仅实现了打破西方对超跑的技术垄断,同时实现了对外输出超跑的产品、技术、文化和高端品牌的出海,实现了中国汽车工业新的飞跃。昊铂SSR去年10月正式上市以来,以超跑为载体,从研发、设计、试制试验、智造、产业链等,全方位提升中国汽车工业能力,也为中国汽车运动文化注入新力量,促进中国体育文化发展,也推动汽车文化的普及,助力中国从汽车大国迈向汽车强国。昊铂秉持低调务实、保持热诚的作风,征服了全球最顶尖的同行。汽车设计领域的璀璨明星Pontus Fontaeus,因其与法拉利、布加迪和兰博基尼等豪华车品牌的卓越合作而赫赫有名。如今,这位设计巨匠选择与昊铂携手,亲手打造出昊铂SSR这件璀璨的艺术品。伴随着昊铂全球化战略,凝结了中国工业最高技术水准的昊铂SSR,来到了全球用户的面前。去年昊铂SSR海外首秀,在国际舞台上也得到了超跑爱好者的喜爱。在泰国车展,昊铂SSR创下中国汽车出口史上“最高单价”的记录。(未来汽车日报)
7月29日,吉利对一块历经921次充放电(约40万公里行驶里程)的神盾短刀电池包进行了容量检测,结果显示健康度仍然高达90.5%。而同级产品搭载的电池包,在完成500次充放电之后,健康度就衰减到了80%,寿命远低于神盾短刀电池包。 同时,吉利还对一辆行驶里程超30万公里的银河E5耐久测试车进行了电池包拆解。拆解结果显示电池包的结构依然完整、防护完好。 8月3日,搭载神盾短刀电池的银河E5即将全球上市,并实现上市即交付。(未来汽车日报)
7月25日,比亚迪王朝全新中级SUV宋L DM-i在开封上市,新车基于新技术、新平台、新标准打造,百公里亏电油耗低至3.9L,满油满电综合续航超1500km,以“大宋”之名开创SUV油耗3时代,颠覆用户对中级SUV的油耗续航认知。宋L DM-i此次推出纯电续航里程75KM、112KM和160KM三个版本,共5款车型,售价13.58万-17.58万元。极致低能耗带来超长续航,宋L DM-i满油满电综合续航达1500km,宋L DM-i基于新一代插混整车平台打造,引领中级SUV向更优越驾乘空间和更高级驾乘体验进化。新车长宽高分别为:4780*1898*1670毫米,轴距达2782毫米,比途观L Pro(4735*1842*1682毫米)更长更宽,带来更宽奢的空间体验。纯平后排地板、超宽横向空间,让后排中座成为“C位”,加上宽舒云感座椅,带来前排头等舱、后排大沙发的舒适出行体验。超大后备箱可轻松放下全家行李,更可纯平放倒变身双人床,不管全家购物还是惬意露营,都能轻松满足。(未来汽车日报)
7月26日消息,7月25日,深蓝汽车全球战略车型“深蓝S07”正式上市,共推出增程加纯电10款配置车型,售价区间14.99万元-21.29万元,同时全系车型限时优惠1万元,其中215Max增程版、215Max乾崑智驾ADS SE版、215Pro增程版为深蓝S7经典再升级版本。深蓝S07左手深蓝超级增程,右手华为乾崑智能,在20万级中型SUV市场,携20大同级首发、50大同级领先的科技配置,打造同级领先科技含金量。随着的深蓝S07上市,意味着智能驾驶技术步入普及化新阶段,不仅满足了用户的智驾需求,也重新定义了智驾体验的价值感。华为乾崑智驾采用主视觉方案,与特斯拉纯视觉逻辑相同,在决策和规划时更加类人化,行驶轨迹更接近人类驾驶,拥有更高通行效率。但在华为乾崑智驾背后,有华为大数据模型为支撑,这一点与特斯拉纯视觉方案截然不同,实现了对驾驶环境的全方位感知和精准决策。同时,大数据模型还具备强大的学习和迭代能力,能够不断优化算法模型,提升驾驶辅助的精度和安全性。特斯拉在复杂场景下的理解能力和决策精度上,往往难以与华为乾崑智驾相媲美,这也是深蓝S07比肩特斯拉的底气。(未来汽车日报)