理想汽车迈向全球领先的人工智能企业-车市号

理想汽车迈向全球领先的人工智能企业

车坛视点

32054 2024-12-28

2024年12月25日-27日，理想汽车连续三天推出“2024理想 AI Talk”，分享了对人工智能的最新思考，以及包含智能驾驶和理想同学在内的人工智能技术的最新进展，并宣布基于自研基座大模型Mind GPT的理想同学从车机进入手机，App已于12月27日全量上线。此外，理想汽车宣布OTA 7.0版本车机系统将于12月底全量推送AD Max用户，新增AI推理可视化、高速端到端等功能，并实现Mind GPT-3o、Mind Diffusion V2.0的能力升级。

理想同学和智能驾驶是理想汽车的两大核心AI产品。理想汽车董事长兼CEO李想表示：“我们在做的理想同学和自动驾驶，通常被视作独立的领域。我们的大语言模型Mind GPT是认知智能，连接数字世界；而自动驾驶被称为空间智能，关乎物理世界。我们同时在这两个领域探索，并坚信认知智能与空间智能的结合——我们称之为VLA（Vision Language Action Model，视觉语言行动模型）——是一个更值得相信和追求的机遇。”

李想表示，理想汽车的愿景已升级为“连接物理世界和数字世界，成为全球领先的人工智能企业”，汽车是连接这两个世界的最佳桥梁。

“从企业角度来看，理想汽车是一家人工智能企业，我们要做的不是汽车的智能化，而是人工智能的汽车化，并将推动人工智能普惠到每一个家庭。从行业视角来看，汽车将从工业时代的交通工具，进化成为人工智能时代的空间机器人。在对整个世界的理解上，我们通过人工智能将物理世界与数字世界进行融合，让有限的空间实现无限的延伸。”李想表示。

理想同学App，随时随地陪伴你的智能助手

理想同学App是一款人工智能应用，目前具备两大功能：“知识问答”提供多领域的问答能力，包括汽车、出行、财经、科技等领域，并能处理多种文本任务，如撰写文章、翻译和创作文案等；“看世界”依靠视觉感知能力，帮助用户识别菜单、画作、动植物、汽车等上千种通用物品。

从车机进入手机，理想同学从智舱智能助理转变为通用智能助手。从用户需求的角度出发，这是一件顺理成章的事情。很多理想汽车用户的孩子首次接触的人工智能产品就是理想同学，它通过对话帮助孩子们解决各种问题，比如画画或写作业等。理想汽车希望让100多万的车主及其家庭成员，不仅在汽车，还可以在手机、电脑，甚至眼镜等穿戴设备上，体验到一致的人工智能产品。其次，从长远角度来看，理想汽车认为，在掌握基座模型的前提下，真正的大模型产品会覆盖所有的设备，能让用户自主使用所有的服务。

目前，大模型技术尚处于发展早期，很多团队仍停留在聊天机器人的初始阶段，所有参与者都有探索未知边界的机会。理想汽车凭借100多万的家庭基础和在自动驾驶领域的技术积累，能够在追随优秀竞争对手的同时，实现更有效的投入。

L3有监督智能驾驶，不是L2辅助驾驶的延续，而是L4自动驾驶的先导

在自动驾驶的不同阶段，L3为有监督智能驾驶，不是L2辅助驾驶的延续，而是L4高度自动驾驶的先导程序。

辅助驾驶只实现了特定功能，自动驾驶则关乎整体能力。传统的L2辅助驾驶依赖上一代自动驾驶方案，通过预设条件来执行不同场景下的智驾功能，无法穷尽所有的corner case（极端情况）。理想汽车借鉴人类驾驶技能提升的过程，用人工智能的方式做自动驾驶，推出了端到端+VLM的双系统解决方案，利用Scaling Law（规模效应）不断迭代和提升自驾能力，以适应所有可能的驾驶环境。

自7月底推出端到端智能驾驶的内测版以来，理想汽车以每周更新两个模型版本的频率，致力于在今年将综合MPI（城市+高速平均接管里程）提升至100公里。展望未来两年，还将逐步提升MPI至500公里甚至1000公里以上。为了达到MPI 500公里的目标，预估需要2000万Clips（视频片段），意味着积累50亿公里甚至超百亿公里的数据量。

随着端到端+VLM双系统的不断迭代，理想汽车希望在2025年实现L3有监督智能驾驶，并为用户提供一个全场景、一体化端到端的产品。理想汽车认为，达到L3的前提是实现“车位到车位”的智能驾驶，这将自动驾驶服务从干道提前到小区车位，解决最先100米和最后100米的挑战。11月底，理想汽车已全球首家全量推送“车位到车位”功能，有效应对了小区道路、环岛、掉头和复杂施工的场景。

此外，理想汽车将在12月底通过OTA 7.0版本车机系统向所有AD Max用户全面推送“高速端到端”和行业首创的“AI推理可视化”功能。其中，“高速端到端”将实现高速特殊场景NOA不降级、不断点、更连续，使理想汽车成为国内唯一一家、全球第二家将端到端技术应用到高速（及环路）NOA场景的车企。“AI推理可视化”通过展示10种可能的策略轨迹并实时选出最佳方案，同时以热力图形式直观展现端到端系统在不同区域的关注度，将帮助驾驶员更直观地理解AI的决策逻辑。

安全，是体验的基石。虽然理想汽车在国内率先取消了角毫米波雷达，转而采用以纯视觉为主的技术路线，但仍然保留了激光雷达，并将其视作“安全带”，与视觉技术配合，以期达到消除所有重大伤亡事故的目标。通过持续的OTA升级，理想汽车为用户提供了行业领先的安全能力，包括全自动紧急转向AES（自动紧急转向）、全速域无上限激活AEB（自动紧急制动）、及城市路口多方向人车混行场景AEB等。至今，安全技术已成功预防超415万起潜在事故，超1000起烈性事故，一定程度上保障了驾驶安全。在OTA 7.0更新中，理想汽车还将向AD Max用户升级应对大雾天气的高速智驾策略，实现业内场景覆盖最全ELK（紧急车道保持辅助）。

得益于今年理想汽车在智驾领域的快速进步，截至12月中旬，AD Max销量占比已从2月份的约20%增长至50%以上，30万以上车型AD Max销量占比已超75%。

在技术、产品、环境政策，以及消费者对人工智能信任度到位的前提下，理想汽车有望在三年后推出首款为L4级自动驾驶定义的汽车。在此之前，企业也必须满足3个条件：500万辆以上规模的车队、掌握VLA基础模型的能力、有足够多的钱去招募最顶级的人才以及足够的算力。

应用AI技术，推动快速成长

目前，理想汽车超100亿的年研发投入已有接近一半聚焦于人工智能，并建立了四支AI团队，分别解决不同问题。

在智能驾驶领域，凭借充足的训练里程和先进的训练算法，加之利用世界模型创建的模拟环境，理想汽车推出了行业首创的端到端+VLM双系统方案。该方案自7月底启动早鸟计划以来，以每周两次的频率迭代更新，在10月底正式全量推送，11月底新增“车位到车位”功能，并将在12月底推出“高速端到端”功能。随着数据规模的扩大和数据质量的提升，理想汽车已经成功验证了Scaling Law在提高自动驾驶性能方面的作用。截至12月25日，理想汽车智驾总里程已达29亿公里，训练算力提升至8.1EFLOPS。

在理想同学方面，其搭载了自研的行业首个车载认知大模型Mind GPT。截至目前，该模型已积累10万亿Token的预训练数据，覆盖自动驾驶、对话等场景中特有的多模态数据。自2023年12月发布以来，Mind GPT已迭代30多次，将伴随OTA 7.0进入到第三阶段，即Mind GPT-3o，进一步发展任务助手、认知成长和情感陪伴能力。与前两代侧重语言模型不同，Mind GPT-3o将通过构建融合感知和认知的多模态端到端大模型能力，大幅降低人机交互延迟。

在智能商业方面，理想汽车通过大模型技术与商业领域数据和知识的深度结合，构建了一批具备零售、营销、金融、财经分析等能力的AI助手。例如，在零售领域，AI通过学习顶尖零售专家的沟通技巧，为更多零售伙伴培训、赋能；在服务方面，AI模型掌握了丰富的车辆使用知识，通过智能的多轮对话有效解决用户咨询，提升服务效率、释放呼叫中心的坐席压力等。

在智能工业方面，理想汽车通过全栈自研的智能制造系统、视觉算法、设备、质量预测模型等，依托于Li-MOS生产管理系统、连山云端质量预警平台、MESS系统等自研的智能化平台构建起智能制造超级大脑，横向上实现从研发端到交付端的数据闭环，纵向实现多层供应链到整车厂的数据协同，以数据驱动生产、快速迭代生产技术，从而持续提高制造效率和产品质量。

理想汽车AGI实现的战略地图

为了实现AGI，理想汽车发布三阶段的战略路线图。

第一阶段称为“增强我的能力”。在这一阶段，理想同学能为用户提供辅助功能，自动驾驶领域实现L3有监督智能驾驶。此时，AI技术已经能显著提升人类的工作效率和便捷性，但AI还无法独立，需要人类来兜底。

第二阶段叫做“成为我的助手”。AI将推进至L4级别的自动驾驶与Agent阶段的理想同学。例如，用户可以简单地指示一辆L4级别的汽车去接孩子，无需亲自在场，车辆就能自行前往学校，通过面部识别技术让孩子安全上车。在这个阶段，理想同学代表的认知智能，与自动驾驶代表的空间智能，将会结合成一个模型，理想汽车称之为VLA。AI会出现大规模的应用，是真正的iPhone4时刻。

第三阶段升级为“成为我的硅基家人”。人类不再需要向AI发出任何指令。AI能够延续并运用人类的记忆，自主做出决策，并主动执行多项任务，成为家庭的重要成员。硅基家人是AGI的最终产品。

从智能电动车企业升维转型为人工智能企业，未来，理想汽车将始终把用户价值放在第一位，秉持“超越用户的需求，创造让我们自豪的产品和服务”的企业价值观，为更多用户创造移动的家，创造幸福的家。

声明：本文由车市号作者撰写，仅代表个人观点，不代表网上车市。文中部分图片来源网络，感谢原作者。