科技财经局
48834 2024-12-28
2024年12月25日-27日,理想汽车连续三天推出“2024理想 AI Talk”,分享了对人工智能的最新思考,以及包含智能驾驶和理想同学在内的人工智能技术的最新进展,并宣布基于自研基座大模型Mind GPT的理想同学从车机进入手机,App已于12月27日全量上线。此外,理想汽车宣布OTA 7.0版本车机系统将于12月底全量推送AD Max用户,新增AI推理可视化、高速端到端等功能,并实现Mind GPT-3o、Mind Diffusion V2.0的能力升级。
理想同学和智能驾驶是理想汽车的两大核心AI产品。理想汽车董事长兼CEO李想表示:“我们在做的理想同学和自动驾驶,通常被视作独立的领域。我们的大语言模型Mind GPT是认知智能,连接数字世界;而自动驾驶被称为空间智能,关乎物理世界。我们同时在这两个领域探索,并坚信认知智能与空间智能的结合——我们称之为VLA(Vision Language Action Model,视觉语言行动模型)——是一个更值得相信和追求的机遇。”
李想表示,理想汽车的愿景已升级为“连接物理世界和数字世界,成为全球领先的人工智能企业”,汽车是连接这两个世界的最佳桥梁。
“从企业角度来看,理想汽车是一家人工智能企业,我们要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭。从行业视角来看,汽车将从工业时代的交通工具,进化成为人工智能时代的空间机器人。在对整个世界的理解上,我们通过人工智能将物理世界与数字世界进行融合,让有限的空间实现无限的延伸。”李想表示。
理想同学App,随时随地陪伴你的智能助手
理想同学App是一款人工智能应用,目前具备两大功能:“知识问答”提供多领域的问答能力,包括汽车、出行、财经、科技等领域,并能处理多种文本任务,如撰写文章、翻译和创作文案等;“看世界”依靠视觉感知能力,帮助用户识别菜单、画作、动植物、汽车等上千种通用物品。
从车机进入手机,理想同学从智舱智能助理转变为通用智能助手。从用户需求的角度出发,这是一件顺理成章的事情。很多理想汽车用户的孩子首次接触的人工智能产品就是理想同学,它通过对话帮助孩子们解决各种问题,比如画画或写作业等。理想汽车希望让100多万的车主及其家庭成员,不仅在汽车,还可以在手机、电脑,甚至眼镜等穿戴设备上,体验到一致的人工智能产品。其次,从长远角度来看,理想汽车认为,在掌握基座模型的前提下,真正的大模型产品会覆盖所有的设备,能让用户自主使用所有的服务。
目前,大模型技术尚处于发展早期,很多团队仍停留在聊天机器人的初始阶段,所有参与者都有探索未知边界的机会。理想汽车凭借100多万的家庭基础和在自动驾驶领域的技术积累,能够在追随优秀竞争对手的同时,实现更有效的投入。
L3有监督智能驾驶,不是L2辅助驾驶的延续,而是L4自动驾驶的先导
在自动驾驶的不同阶段,L3为有监督智能驾驶,不是L2辅助驾驶的延续,而是L4高度自动驾驶的先导程序。
辅助驾驶只实现了特定功能,自动驾驶则关乎整体能力。传统的L2辅助驾驶依赖上一代自动驾驶方案,通过预设条件来执行不同场景下的智驾功能,无法穷尽所有的corner case(极端情况)。理想汽车借鉴人类驾驶技能提升的过程,用人工智能的方式做自动驾驶,推出了端到端+VLM的双系统解决方案,利用Scaling Law(规模效应)不断迭代和提升自驾能力,以适应所有可能的驾驶环境。
自7月底推出端到端智能驾驶的内测版以来,理想汽车以每周更新两个模型版本的频率,致力于在今年将综合MPI(城市+高速平均接管里程)提升至100公里。展望未来两年,还将逐步提升MPI至500公里甚至1000公里以上。为了达到MPI 500公里的目标,预估需要2000万Clips(视频片段),意味着积累50亿公里甚至超百亿公里的数据量。
随着端到端+VLM双系统的不断迭代,理想汽车希望在2025年实现L3有监督智能驾驶,并为用户提供一个全场景、一体化端到端的产品。理想汽车认为,达到L3的前提是实现“车位到车位”的智能驾驶,这将自动驾驶服务从干道提前到小区车位,解决最先100米和最后100米的挑战。11月底,理想汽车已全球首家全量推送“车位到车位”功能,有效应对了小区道路、环岛、掉头和复杂施工的场景。
此外,理想汽车将在12月底通过OTA 7.0版本车机系统向所有AD Max用户全面推送“高速端到端”和行业首创的“AI推理可视化”功能。其中,“高速端到端”将实现高速特殊场景NOA不降级、不断点、更连续,使理想汽车成为国内唯一一家、全球第二家将端到端技术应用到高速(及环路)NOA场景的车企。“AI推理可视化”通过展示10种可能的策略轨迹并实时选出最佳方案,同时以热力图形式直观展现端到端系统在不同区域的关注度,将帮助驾驶员更直观地理解AI的决策逻辑。
安全,是体验的基石。虽然理想汽车在国内率先取消了角毫米波雷达,转而采用以纯视觉为主的技术路线,但仍然保留了激光雷达,并将其视作“安全带”,与视觉技术配合,以期达到消除所有重大伤亡事故的目标。通过持续的OTA升级,理想汽车为用户提供了行业领先的安全能力,包括全自动紧急转向AES(自动紧急转向)、全速域无上限激活AEB(自动紧急制动)、及城市路口多方向人车混行场景AEB等。至今,安全技术已成功预防超415万起潜在事故,超1000起烈性事故,一定程度上保障了驾驶安全。在OTA 7.0更新中,理想汽车还将向AD Max用户升级应对大雾天气的高速智驾策略,实现业内场景覆盖最全ELK(紧急车道保持辅助)。
得益于今年理想汽车在智驾领域的快速进步,截至12月中旬,AD Max销量占比已从2月份的约20%增长至50%以上,30万以上车型AD Max销量占比已超75%。
在技术、产品、环境政策,以及消费者对人工智能信任度到位的前提下,理想汽车有望在三年后推出首款为L4级自动驾驶定义的汽车。在此之前,企业也必须满足3个条件:500万辆以上规模的车队、掌握VLA基础模型的能力、有足够多的钱去招募最顶级的人才以及足够的算力。
应用AI技术,推动快速成长
目前,理想汽车超100亿的年研发投入已有接近一半聚焦于人工智能,并建立了四支AI团队,分别解决不同问题。
在智能驾驶领域,凭借充足的训练里程和先进的训练算法,加之利用世界模型创建的模拟环境,理想汽车推出了行业首创的端到端+VLM双系统方案。该方案自7月底启动早鸟计划以来,以每周两次的频率迭代更新,在10月底正式全量推送,11月底新增“车位到车位”功能,并将在12月底推出“高速端到端”功能。随着数据规模的扩大和数据质量的提升,理想汽车已经成功验证了Scaling Law在提高自动驾驶性能方面的作用。截至12月25日,理想汽车智驾总里程已达29亿公里,训练算力提升至8.1EFLOPS。
在理想同学方面,其搭载了自研的行业首个车载认知大模型Mind GPT。截至目前,该模型已积累10万亿Token的预训练数据,覆盖自动驾驶、对话等场景中特有的多模态数据。自2023年12月发布以来,Mind GPT已迭代30多次,将伴随OTA 7.0进入到第三阶段,即Mind GPT-3o,进一步发展任务助手、认知成长和情感陪伴能力。与前两代侧重语言模型不同,Mind GPT-3o将通过构建融合感知和认知的多模态端到端大模型能力,大幅降低人机交互延迟。
在智能商业方面,理想汽车通过大模型技术与商业领域数据和知识的深度结合,构建了一批具备零售、营销、客服、金融、财经分析等能力的AI助手。例如,在零售领域,AI通过学习顶尖零售专家的沟通技巧,为更多零售伙伴培训、赋能;在客户服务方面,AI模型掌握了丰富的车辆使用知识,通过智能的多轮对话有效解决用户咨询,提升服务效率、释放呼叫中心的坐席压力等。
在智能工业方面,理想汽车通过全栈自研的智能制造系统、视觉算法、设备、质量预测模型等,依托于Li-MOS生产管理系统、连山云端质量预警平台、MESS系统等自研的智能化平台构建起智能制造超级大脑,横向上实现从研发端到交付端的数据闭环,纵向实现多层供应链到整车厂的数据协同,以数据驱动生产、快速迭代生产技术,从而持续提高制造效率和产品质量。
理想汽车AGI实现的战略地图
为了实现AGI,理想汽车发布三阶段的战略路线图。
第一阶段称为“增强我的能力”。在这一阶段,理想同学能为用户提供辅助功能,自动驾驶领域实现L3有监督智能驾驶。此时,AI技术已经能显著提升人类的工作效率和便捷性,但AI还无法独立,需要人类来兜底。
第二阶段叫做“成为我的助手”。AI将推进至L4级别的自动驾驶与Agent阶段的理想同学。例如,用户可以简单地指示一辆L4级别的汽车去接孩子,无需亲自在场,车辆就能自行前往学校,通过面部识别技术让孩子安全上车。在这个阶段,理想同学代表的认知智能,与自动驾驶代表的空间智能,将会结合成一个模型,理想汽车称之为VLA。AI会出现大规模的应用,是真正的iPhone4时刻。
第三阶段升级为“成为我的硅基家人”。人类不再需要向AI发出任何指令。AI能够延续并运用人类的记忆,自主做出决策,并主动执行多项任务,成为家庭的重要成员。硅基家人是AGI的最终产品。
从智能电动车企业升维转型为人工智能企业,未来,理想汽车将始终把用户价值放在第一位,秉持“超越用户的需求,创造让我们自豪的产品和服务”的企业价值观,为更多用户创造移动的家,创造幸福的家。
声明:本文由车市号作者撰写,仅代表个人观点,不代表网上车市。文中部分图片来源网络,感谢原作者。
竟然没评论,快去评论~~