驾仕派
38281 2024-12-27
2024理想AI Talk第二天的内容对于一个比较熟悉端到端智驾的媒体来说可能信息量并不大。但是这一期节目能够让我们大概理解到理想汽车内部是如何思考端到端智驾的,也能够看到端到端智驾大概追赶的速度有多快、能力差异在哪里,以及李想本人对端到端技术价值的长远认识。
1、 理想汽车在智驾层面的快速发展得益于李想对智驾团队的一次不满。之后智驾团队迅速选择了端到端技术作为突破口,朗咸朋就说理想内部的这个端到端的预研,但是从那一刻开始,理想端到端的速度就加快了,然后开始进行了一次封闭开发。按照郎咸朋的说法,其实只用15天就做出了一个能够在城区上路的Demo,纵向控制已经比之前规则开发出来的效果更好。李想也说“这一个月的训练,比过去三年做的东西,进步速度要快!”
从这段我们也可以理解到,车企要做一个端到端的智驾,基础能力其实花费不了多少时间,可能在很短时间就可以构建出能用的基本技术。
2、 理想汽车作为智驾的后来者,为什么能够后来居上呢?朗咸朋解释,理想汽车需要等待足够的数据和算力,等到了他们才能上。他的观点是端到端 VLM大模型其实最终的本质是用人工智能来做自动驾驶。人工智能的三个要素——算法、数据和算力,这三个要素必须全都齐备。理想汽车今年是准备好了,所以他们能做这个事情。
这个说法其实也解释了为什么理想汽车在4月份做出了初版端到端技术之后就可以快速迭代。因为理想AD Max 车型的销量开始起来,去年起量之后到今年初(高质量训练)数据量达到10亿公里左右规模,按照理想的推算方式至少有400万Clips。其次是算力基础,理想汽车在去年买了大量的算力卡,今年年初算力到了5EFLOPS,在国内车企中肯定是第一梯队。最后则是理想内部认可了端到端技术是智驾的方向,那么砸钱的速度就可以很快。
3、 理想在智驾上面参考了特斯拉的One Model路线、纯数据驱动,但是自己加了VLM视觉语言大模型,相当于两者配合。
这里可以解释下VLM的逻辑,其实在AI领域也有多个模型的配合。个人理解是,VLM作为一个车端多模态的小模型,在端到端技术执行的过程中,VLM可以做一些AI推理来确认决策是不是应该这么做。如果发现这个决策可能不对,那就反馈给端到端模型,让端到端再进一步处理。相当于VLM只是一个感知、然后推理出决策,看看是否合理,不合理就上报,但是也不会去具体执行。就比如端到端没办法知道潮汐车道,但是VLM看到潮汐车道后可以推理出潮汐车道这时候不能走,然后汇报给端到端的模型,再由端到端去判断执不执行。
4、 按照朗咸朋的说法,理想内部肯定认为根据现在的端到端+VLM这套体系,能力继续迭代的话,他们是有希望在2025年去实现L3的——这基本上是要求500-1000公里接管一次。
朗咸朋表示,要达到500公里的综合MPI(城市+高速综合接管里程),预计需要2000万Clips(视频片段)的水平。如果2000万Clips从不到5%的老司机去筛选,这里隐含的数据量,要达到50亿公里甚至上百亿公里的水平。
这背后还有一个要求就是算力,按照年初理想处理400万Clips需要5EFOLPS的算力来看,处理2000万Clips那也就是20EFOLPS。这一点其实也和特斯拉现在去构建10万张算力卡、之后超过100EFOLPS的算力也是一致的。
5、 李想本人的说法,他并不觉得端到端是自动驾驶的终极答案。他说端到端只能解决L3,解决不了L4。要解决L4的问题,李想给出的一个预判需要三个能力:第一,需要500万辆车在路上跑、能够收集到足够优质的训练信息;第二,需要自己掌握VLA(视觉-语言-行动大模型);第三,拥有足够多的钱,这样才能招募到顶级人才,才有算力支持。
这里面李想的观点也是当前AI科技界的一个共识。端到端不是解决一切的方案,因为端到端最大的短板就是需要有无穷尽的数据去做训练,但很多时候训练数据是有穷尽的。
有人举了一个例子,人去摆放零部件,可能错几次就知道怎么能够摆放正确,就没有合适的训练数据了。但是以特斯拉的人形机器人Optima为例,它就需要足够多的训练数据去学习怎么摆放零部件,否则它会因为各种问题而失误,这就无法用单纯的端到端技术解决。所以端到端本身无法去完全解决自主学习这个事情,它可以通过调整参数和大规模训练去解决Corner Case,也就是一组问题,但是不能完全应对完全无法预知的问题。这也就注定了端到端无法实现L4功能。
6、 最后李想认为,现在中国的汽车仍然非常内卷。他说电动化和智能化是两场仗,电动化其实是相当于是一张门票,到了L4会分出真正的胜负。但是理想汽车今天在做的所有事情,是为了L4拿门票,因为L4所需要花的钱,所需要拥有的能力,所需要的数据量,是今天还不具备的,所以今天大家要靠这个东西去拿L4的门票。
文 | JackieLXX
图 | 网络
声明:本文由车市号作者撰写,仅代表个人观点,不代表网上车市。文中部分图片来源网络,感谢原作者。
竟然没评论,快去评论~~