撰文 / 周 洲
编辑 / 张 南
设计 / 师 超
“现在行业上对自动驾驶尤其是无人驾驶非常悲观,但熟悉轻舟的朋友们都知道,‘将无人驾驶带进现实’ 是我们轻舟的愿景,也是我们奋斗的方向。今年蓝皮书论坛的主题是‘不负’,那么我们也希望不辜负当下最好也是最坏的时代,最终将实现无人驾驶带入到千家万户。”6月16日,轻舟智航联合创始人、CEO于骞在第十五届中国汽车蓝皮书论坛上发表了主题为“不负韶华,将无人驾驶带进现实”的演讲。
于骞指出,无人驾驶的目标一定是前途光明的,但是道阻且长、行则将至。
【资料图】
他从三个方面进行了阐述:算法、数据和量产交付。
于骞在演讲中提出,在城市NOA大范围普及之后,完全的无人驾驶才会出现。“但首先,需要当城市NOA最终得以达到一定的渗透率之后,无人驾驶的大幕才会拉开,城市NOA是辅助驾驶的天花板,也是无人驾驶的入门门槛。这里需要大量数据的积累。”
轻舟智航认为,城市NOA需要大量数据的积累才能最终将完全的无人驾驶带到现实中来。良好的感知、规控的能力都离不开数据方面的积累和使用能力。
在量产交付中,基于自身经验,于骞总结了三大挑战:
第一,极致体验和成本的挑战。目前智能驾驶的体验尚未达到消费者愿意为其付费的水平,只有通过将体验提升到极致水平,才能形成正向循环。而要实现正向循环,体验必须达到一定效果,并且在成本方面,需要避免过度堆砌材料以实现更好的客户价值。
第二,一次性交付和持续OTA的挑战。因为智驾的方案不是简单一手交钱一手交货,更需要OTA不断升级,使得它越用越好,常用常新。轻舟可以为主机厂客户提供一整套的工具链产品,大幅度降低开发的成本。
第三,全栈自研和自主可控的挑战。相对而言,如果主机厂采用“全栈可控”的模式,性价比将更高,供应商的分工也可以更加灵活。然而,管理供应商需要投入成本,并且在与多个供应商合作时需要解决上下游的冲突问题。
轻舟智航认为,在确保全栈可控的基础上,让专业的人做专业的事,一方面专业的供应商可以帮助主机厂更快地完善产品并交付,另一方面还可以提供技术服务,帮助主机厂更快地建立自主研发的能力。
轻舟智航在成立之初,就应用类似ChatGPT大模型的方法,采用BEV top-down的模型,实现非常复杂的感知能力,通过在一个车载模型上跑数十个不同的任务来实现效率的提升。
轻舟智航也是比较早的运用前、中、后融合的技术,包括将时序融合用在车规级量产芯片的公司。其拥有非常灵活的框架,可以同时支持不同传感器的信息,适配不同车型的传感器要求,使其在不同的车型配置上能够采用同样的模型来实现完全视觉感知能力,例如在城市道路,过高架、城区包括拥挤路段、快速路段还有隧道等多任务,还包括一般障碍物和语义的信息等。
在只基于SD MAP的情况下,轻舟智航通过Transformer架构的感知地图的QmapNet来实现道路几何的感知和SD MAP融合,具备通过复杂路口以及精确的拓扑的建图能力,从而将其感知能力和标精地图实时匹配起来,达到在城市内部实现比较复杂的驾驶能力。
此外,轻舟智航最早在行业中最早推出时空联合规划的方法,并实现在实车车规量产芯片上跑起来。
良好的感知、规控的能力都离不开在数据方面的积累和使用能力。轻舟智航是在行业里很早就将基于纯视觉的NeRF的建图方式和三维重建的真值标注系统结合在一起,实现大规模的非监督形式标注,来提高整体标注效率的公司。
无人驾驶的落地是一个渐进的过程,还需要政策法规、保险、运维等各方配套。
于骞在现场倡议如下:一是在安全使用数据、共享数据方面,需要各行业协会、政府、上下游企业群策群力,共同制定并推动相应法律法规的出台和落地,规范数据的使用;二是建立数据共享和应用联盟,在保障数据安全的前提下,构建汽车数据共享机制及平台,实现数据的共享和高效流通,提高数据利用和闭环水平。
以下是于骞演讲实录。
无人驾驶到底是不是忽悠?最近这段时间大家对整个无人驾驶行业进展都非常悲观,我们与业内人员也讨论过这件事,那么,我今天为什么还要讲主题叫“将无人驾驶带进现实”?
将无人驾驶带进现实就是轻舟智航奋斗的方向,地平线的余凯总也跟我讲过很多次,别讲无人驾驶带进现实了,无人驾驶到底行不行啊?我们认为,将无人驾驶带进现实的这个事儿要干二十年,在二十年里无人驾驶是可以实现的。
今天蓝皮书主题是“不负”,我也想表达一下“不负”,是不负我们的初心,我们认为这件事儿是能够实现的。当然实现无人驾驶的道路是非常曲折的,有很多不同的路线,其中有一条路线大家都非常清楚,就是Waymo的路线。
Waymo从2009年开始在X实验室就开始做无人驾驶的项目,即便到今天也没有完全将无人驾驶大范围的落地。它其实走了一条非常痛苦的一条路,非常难的一条路,当然也取得好的进展。最近大家可以看到完全无人化的车队已经成规模的运营,这是很挑战的路。
另外一条路是特斯拉,特斯拉走了非常巧妙的路。它通过以智能电动车的方式在不断地推进,特斯拉走的路非常符合用户价值。虽然它们现在讲的都是辅助驾驶比较多,但它们给自己的最终目标还是要实现完全的无人驾驶。可以看到它对FSD的命名Full Self-Driving,包括它最终给大家描绘的图景也是无人驾驶的方式。所以我认为这两条路都可以通过不同的努力路径来实现最终的无人驾驶。
从整个无人驾驶的发展来看,我觉得前途是光明的,只不过这个道路很长,行之将至。在这条道路上我觉得最核心的还是要始终围绕用户价值,不管是供应商来讲还是车厂,大家都希望将无人驾驶带到现实中来,因为无人驾驶很大程度上能够让我们整个出行和交通更加安全,更加舒适,更加便捷,这都是我们希望无人驾驶能够带来的,但这条路会非常长。
从早期做ADAS产品开始,就是一步一步这么走过来的,我觉得这条路是非常现实的路。包括特斯拉也在这条路上一直在狂奔,从最早的基础ADAS功能,到L2+的功能,再到现在做到的高速NOA和城市NOA,最终将无人驾驶带进现实的目标。最早特斯拉产品的定义名字叫Autosteer就是基础的L2的功能,它的Autopilot高速NOA到FSD进入到城市NOA的阶段,在这条路上来讲,最终是有机会走到完全无人驾驶的。
什么时间完全无人驾驶才会出现呢?很大程度上,我觉得应该在城市NOA大范围普及之后,完全的无人驾驶才会出现。如果现在公开道路上的车有十分之一或者是五分之一的车能够在公开道路上使用城市NOA的功能,能够打开的话,我觉得这个离我们最终将无人驾驶的普及就不远了。
我们可以参考ChatGPT的发展,它基本上把地球上有价值的语言文字信号都利用起来以后,就可以打开从量变到质变的过程。类比自动驾驶的行业,当我们在整个地球上所有有价值的街景的数据都能为我们所利用的时候,我们模型能力也能把他们用好的情况下,这时候我觉得完全的无人驾驶就会到来。
但我觉得像高速NOA和城市NOA这样的阶段是必不可少的,一定会度过的,怎么去验证完全的无人驾驶能够到来?它一定是通过大量的统计数据。比如说机器驾驶的安全程度比人安全十倍,这个时间点是不是就可以真正的完全去实现了?但这个一定要通过更加广泛的验证才能得到。也有其他的观点提到可能不需要十倍,可能五倍搞定了,剩下的那两倍靠保险或者其他的方式也能够稿定,但是需要通过大范围的验证来实现完全的商业可行,所以我觉得现在我们所处的这条道路是可以走向完全的无人驾驶,只不过这个道路会比较长。
我们提过,在通向无人驾驶的道路上,有一个非常重要的节点就是城市NOA,它是辅助驾驶的天花板也是无人驾驶的入门门槛。这里需要大量数据的积累。
从自动驾驶的分水岭来讲,早期的ADAS方案是没有办法进化到完全的自动驾驶的。因为基本都是采用一手交钱一手交货这样的交付方式,没有办法触及到数据。
大家知道自动驾驶三个主要要素:算法、算力和数据,这个数据是非常关键的,需要不断OTA升级有数据的触及才可以最终实现。所以,我们认为城市NOA需要大量数据的积累才能最终将完全的无人驾驶带到我们的现实中来。
当然做到很好的城市NOA体验,其实挑战很大。我们现在看到的城市NOA的产品价值还没有完全体现,大部分做的还是非常基础的功能,我也非常赞同目前的高速NOA还没有做好,很多地方的用户体验并不好,更别提城市NOA了,很多城市的NOA体验还是属于战战兢兢的状态。
当然我也看到一些产品的体验在逐渐地变好,有一些泊车的场景已经能做到非常好的体验了。有一些泊车的测试工程师跟我反馈说,测试完泊车的体验以后,他自己的泊车能力都下降了,发现自己都不想泊了。从高速NOA到城市NOA的过程中一定会有这样的过程,使得大家真正愿意为智能驾驶的体验买单,我觉得这才是我们最终将城市NOA带到现实,将无人驾驶带到现实的必经之路,要围绕着用户价值去打造。
在准备材料之前,我们同事问,到底要不要讲技术内容?我说一定要讲技术内容,因为自动驾驶的背后需要大量的技术创新,我们不想跟行业讲我们只是拿了哪些认证,我们更希望在技术创新上给大家多分享,在现阶段到底怎样才能真正的把这些非常有挑战的任务完成好。我尽量会把技术背后的用户价值和客户价值讲清楚。
大家看到最近的ChatGPT的发展有两方面的层次:一方面很重要的是多模态、多任务的学习,这个在我们自动驾驶是非常关键的一步。因为车载的算力是非常有限的,如果我们把这么复杂的自动驾驶的功能,感知的能力切分成很多非常小的模块的话,我们是没有办法在这么有限的资源下实现这样的能力的。
轻舟智航在成立之初,因为人很少,无法把团队切分成很多小模块进行开发,所以我们很早就采用这种大模型的方法,采用BEV top-down的模型去实现非常复杂的感知能力。我们可以通过在一个车载模型上跑数十个不同的任务来实现效率的提升,当然也非常感谢地平线的支持,我们很早就在地平线的征程5芯片上实现了BEV,包括时序的BEV模型部署,达到了量产的状态。
大家经常讲的融合是前融合用的比较多,我们在行业内比较早的运用了前、中、后融合的技术,包括将时序融合用在车规级量产芯片的公司。我们还有非常灵活的框架,可以同时支持不同传感器的信息,包括在底层的,像视觉传感器、毫米波、激光雷达,这样可以更加方便地适配不同车型的传感器要求,使得我们在不同的车型配置上能够采用同样的模型来实现这样的能力。这是完全视觉感知能力,例如在城市道路,过高架、城区,包括拥挤路段、快速路段还有隧道等多任务,这里我们只列了一部分,还包括一般障碍物和语义的信息。
我们在越来越复杂的感知能力上的体现,确实需要多种传感器的融合,同时需要多任务的网络来进行。
另外,关于大家提到的行泊一体,我这里举的例子并不是我们完全要做泊车的任务。为什么很多泊车体验之前做得不好?一方面是算力有限,另外是资源没有把算力资源充分利用起来,大部分采用的是拼接或者分时方案把行泊做在一起,我认为真正的行泊体验一定是与用户侧体验一致,不需要手动切换,能够实现真正的完整体验。
我们把整个泊车感知的能力通过BEV网络重新体现了出来,包括在泊车的传感器,我们也可以更多的把它在行车过程中利用起来,实现真正的行泊一体的完整方案。
左图是我们在行车过程中使用鱼眼摄像头的体验,包括我们在泊车上利用一些BEV、占据网格等实现的功能,可以把传统的技术点在更强算力、更好方法的计算框架下实现能力,所以我们认为新的用户体验一定要有新的方法才能真正达到更好。
刚才也提到无图,在城市NOA里面我认为无图或者轻地图的方式是非常必要的。从高速的地图上来讲,通过一定程度更新的采图,还是比较容易实现的,但是一旦进入到城市的范围内,地图的普及扩大会非常有挑战。
这里为大家介绍我们的感知能力,在只基于SD MAP的情况下,我们通过Transformer架构的感知地图的QmapNet来实现道路几何的感知和SD MAP融合,具备通过复杂路口以及精确的拓扑的建图能力,从而把我们感知能力和标精地图实时匹配起来,达到在城市内部实现比较复杂的驾驶能力。
除了感知和地图能力以外,规控也是在城市导航里面非常具有挑战的一部分。尤其在中国的道路情况下,有各种各样的情况,比如匝道、无保护左转以及窄路的通行,都是具有非常挑战的,但在城市环境下,这些情况却又是不可避免的。
很早以前,轻舟智航对驾驶行为方面做了大量的工作,能够比较好的应对城市内部的驾驶体验。同时,在高速上也是很需要这方面的能力,尤其像智慧躲闪的情况,以及对动态障碍物更好的博弈的策略。我们在行业中最早推出时空联合规划的方法,并实现在实车车规量产芯片上跑起来,目前这种方法也是大家普遍认可了的。传统的方法大部分通过时空解耦的方法,首先在空间中选择一条轨迹再去优化速度,这样的方法对于城市内部的道路是基本上不可能的,会造成很多手写规则、很多逻辑的问题。所以我们通过一个更好的时空联合规划的优化器大量减少人工参与。
当然良好的感知、规控的能力都离不开我们在数据方面的积累和使用能力,我们在行业里,也是很早就将基于纯视觉的NeRF的建图方式和三维重建的真值标注系统结合在一起,实现了大规模的非监督形式的标注,使得整体的标注效率非常高。这也可以看到,我们绝大部分的任务都是靠非监督学习来实现的。在所谓大模型里另外一个非常重要的基石就是能够很好的使用非监督学习。
在成立四年的时间里,我们也得到了很多认可,包括一些论文。今天我们有三篇入选CVPR顶会的论文,此前也有ICCV、CVPR的论文、期刊的论文,以及一些软著和专利的申请。我们还在国内外各类重量级的赛事中崭露头角,在WAIC世界人工智能大会多任务网络学习里获得第一名;在深度估计KITTI也是排名第一;在Argroverse中,2021、2022年,这两次我们都是前三名,2021年是冠军。
在这里,我有一个倡导,在城市范围大规模的导航能力出现的时候,我们特别需要数据方面的积累。尤其在数据使用和共享上还有欠缺很多机制,以及规范的标准,需要全行业的联动和推动,让我们把数据的能力能够充分建立起来,需要行业协会、企业,还有上下游的合作伙伴群策群力,我觉得地平线和贾可老师推出的“公约数”服务平台的方式非常好,能够让我们把很多重复的工作在“公约数”的倡导下建立起来。
我们在量产交付中还遇到了很多挑战和困难,比如极致体验和成本的区分。大部分来讲,我们现在智驾的体验还达不到消费者愿意为它买单的程度,所以只停留在3%-5%的成本,我也非常赞同现在的整个智驾在消费者面前还不是非常必要的选项。
只有把体验做到非常极致了,让消费者愿意买单,这件事情才能形成正向循环,否则大家只能是比成本来杀价格。我觉得正向循环一定要让体验达到一定效果才可以实现。
另外在成本方面,我们一定要避免堆料来实现更好的客户的价值。这里还涉及到一次性交付和持续OTA的挑战,因为智驾的方案不是简单的一手交钱一手交货的问题,更多需要不断OTA升级,使得它越用越好,常用常新,轻舟愿意为主机厂客户提供一整套的工具链产品,可大幅度降低开发的成本。最后,关于全栈自研和自主可控的讨论,这里涉及的行业比较多,我就不多讲了。
现在的行业发展属于非常早期,但在今年车展上,我们看到了基本上有L2及辅助驾驶功能以上的车款已经超过77%,所以已处在了行业非常快的爆发期。包括高速NOA渗透率,从行业的估计来讲,也会从个位数预计到2025年达到25%。
当然,我们希望在2030年可以看到更多具备非常高级的辅助驾驶功能能够出现在我们的车上,包括L3甚至L4的功能。从整个人工智能发展过程看,通用人工智能可能离我们不会太远。如果从未来回看现在的话,很有可能自动驾驶只是很简单的问题,其他很多问题要比这个更复杂,等我们真正走到那一步的时候,可能会有很多不一样的感受。这就像刚才吴声老师讲到的,伟大很多情况下是没办法设计出来的,说不定某天某家公司就提出非常好的方法或技术能够将我们整个技术大范围提升,就像OpenAI在自然语言理解里面实现的东西一样。
道阻且长,不负韶华,我们非常期待将无人驾驶带进现实。