作者 | 王秋凤
如果将苏箐12月8日在地平线生态大会上的讲演,看做本年度“最重量级”技术讲演,可能有争议。从启发性上来看,其信息含量还是相当出众的。这么评价似乎并不为过。
有人嘲笑苏箐前半段讲的非常悲观,讲到后来突然想起地平线副总裁兼首席架构师的角色,才开始“强行乐观”。这种说法并不公平,谁规定演讲只能有一个底色,一段剧情还讲究起伏。即便通篇讲的都是自动驾驶技术发展的现状和预期,但技术及技术的商用化有不同的维度,分别给出不同预判很正常。
兴尽悲来
苏箐演讲的核心观点很清楚:从L2向L3发展的过程中,我们成就很大,但即将触碰到“天花板”。
所谓成就,就是终于确定了“一段式”端到端,为唯一合理技术路径。苏箐对特斯拉FSD V12评价很高(这和他在华为对特斯拉的评价截然相反)。2024年这一版出来之后,特斯拉智驾是不是最强不重要,重要的是方向对了。所有的行为决策里面,终于用数据驱动,全面取代了规则驱动。
此前深度学习只解决了感知的数据驱动,后半段行为决策(就是具体如何开车)仍是规则,这样就有解决不完的长尾问题。就像好不容易洗干净一批脏衣服,下批送来的仍然是脏的要命,这简直令人绝望。
这迫使大家都拿高精图来“补”。因此我们能看到,从2018年~2023年,很多大公司,都拼命地在各大城市“扫街”(用导航车绘制高精图)。余承东还抱怨,上海刚扫完一个月,路况又变了(虽然只是个别变化),以至于高精图的成本根本控制不住。
“补”的到底是什么?显然是静态的先验信息,即所谓的“交通语义”——车道线、路肩、坡度、车道衔接、信号灯、交通标志等,以降低写规则的压力。这就是为什么,当时大家需要高精图。
而一段式端到端+轻图,地图可以不必标太细致,因此也就不用反复扫。重要的是前半段感知和后半段行为,终于用一个方法串起来了。即Transformer注意力机制下的标准算子,终于随着参数规模而“涌现”(表现出智能)。
但是现在,可能即将触碰到深度学习的天花板了。Transformer可以持续迭代,做的更“类人”,苏箐暗示不会超过人类驾驶,这意味着L5绝对没戏。未来几年做苦工,就是这部分训推工作。支撑下一个突破的基本算子,一点影子都没有。一个新理论的诞生,可能需要10、20年才能到工程实现这一步。既然新理论尚未诞生(有小的可能诞生了,但我们没意识到其价值),那么下一个突破就遥遥无期。这才是悲观的最大理由。
如果苏箐的说法成立,2024年的自动驾驶,可能是未来5~10年高点。有点“兴尽悲来,识盈虚之有数”的味道。
乐观在商业红利上
既然如此,乐观到底在何处呢?现在工程界已经将L2、L3、L4路径收敛到一个端到端内核上。沿着这条路,有可能攀升到L4,尽管是有很多限制条件的L4(比如有限ODD区域),但也改变了兜底负责的主体,从驾驶员转为车企。
另一个乐观之处在于,L2现在做的很类人了,会有一个红利期。原来在高档车上才能搭载的系统,现在可以放在10万的车上,也挺好用。表面看上去是硬件成本摊薄(传感器和Soc降价),实际上是算法给后台支持做了减法。包括对减轻对地图的依赖,训练成本更低等。
这就是“智驾普惠”的底气。有没有可能在将来实现L3,甚至有限L4的低成本上车,当然有可能。苏箐甚至预测乘用车和Robotaxi双模部署(一辆车上同时拥有L2和L4)。如果实现,对网约车市场将构成颠覆性改变。
L4攀登路径不明
现在L3量产上路,加了很多限制条件。L4实现路径如何?现在L4明显存在瓶颈,高成本的配置(传感器昂贵)和ODD范围有限(比如亦庄的Robotaxi运营)。真正有商业价值的是大范围的L4(比如超大城市全城范围)。当前在每个小的ODD内打磨L4,开发效率太低了。线性递推的结果,就是成本高到天上。
苏箐将希望寄托在“世界模型”上。虽然世界模型在L2上只能做短时间预测(2、3秒),主要用于防止AEB误动作。但当前主流是基于编码器架构进行轨迹采样,更好的方向,恐怕仍然是因果推理模块,这样可以做更长时间的预测,比如5~10秒。这就很像人脑在开车时的思考方式。但类似模型非常不成熟,尚未看到工程化的迹象。
预测时间更长,就意味着必须进行多分支虚拟世界的推理(有点像奇异博士在《复联4-终局之战》里预测1000多万个钢铁侠与灭霸战斗的不同结局),然后找出最优方案。这只是理论上的目标,如何评估每一条虚拟分支的价值(即某个驾驶方案的好与坏)?可能要用到价值判断,这可能顺便搞定端到端这个“黑盒子”的可解释性,相当于一举两得。但工程上到底如何实现,眼下没人知道。苏箐虽以“L2到L4平滑过渡”来描述,但他主要指的是用同一条路径就可以达致,但怎么个“达致”法,要留给未来。
他隐约觉得,堆算力总有尽头(中国的限制条件在商业效益,而美国则在于电力)。芯片定制化(多核集成NPU、GPU等),则能减低功耗,提升效率,但效能达到什么程度,才能解锁长时间预测能力,又是一个未解的谜题。
结 语
如今,像地平线这种公司,已经从硬件(Soc)制造,逐渐将手伸向算法,做成软硬一体的整体封装方案,供主机厂采购,由后者更多释放到普及型车型上去。这个采购量如果带起来,对整个汽车产业的智驾供应链都有影响。这也意味着芯片设计公司,从Tier2升级为Tier1。
显然,自动驾驶方案公司(比如华为、Momenta、元戎等)并不乐见,因为多了对手。而且这样的对手成本更低,还不要产品定义权,应该是劲敌。
基于以上技术上的探讨。未来几年,全新方法突破不能指望,大家还是要在同一个工程理论上玩命卷完善体验。这也喻示着中期自动驾驶产业竞争,档次提不上去,但足够惨烈。
- E N D -
作者简介:
王秋凤,先后就职于《经济观察报》、《第一财经日报》等主流平面媒体,搜狐汽车新闻中心、腾讯汽车等主流互联网平台,前北汽极狐汽车总裁,现任汽车之家总裁,中国汽车记协常务理事。
