端到端自动驾驶产品即将上市!今年即可入手。

2024-03-22 热点资讯 关注公众号

“未来的竞争只会更激烈,领先的公司可能都会选择闭源路线,这是必须要认清的现实。”

中国自动驾驶行业的端到端模型竞速又有新动向。

3 月 17 日和 3 月 20 日,元戎启行 CEO 周光先后参加中国电动汽车百人会论坛和英伟达 GTC,宣布两项公司的端到端模型进展:

- 搭载元戎启行端到端自动驾驶方案的量产车型,今年就会投入市场。据了解,元戎启行已经谈下至少 4 款量产车型。

- 元戎启行与英伟达达成合作,其端到端模型将会第一时间适配英伟达明年量产的下一代自动驾驶芯片 Thor。

周光在 GTC 上介绍元戎启行自动驾驶端到端方案。

自动驾驶领域的 “端到端” 是指:只用一个模型,就能把摄像头等传感器收集到的感知信息变成车辆方向盘怎么转、油门踩多少等操作信号,让汽车自动行驶。

这之前,自动驾驶的更常见实现方法是模块化方案,把感知、预测、规划分为三个独立模块,其中感知部分使用数据驱动的深度学习模型方法较多,规划部分则需要较多使用传统编程方法写明确定的规则。

“用海量数据训练出来的一个端到端模型,可以让机器拥有自主学习、思考和分析的能力,高效处理道路上各种场景。” 周光认为,端到端模型将会吸引更多车主使用自动驾驶功能。

进入 2024 年,随着特斯拉在北美推送基于端到端的自动驾驶系统 FSD v12,小鹏、理想、蔚来等中国车企跟着加大端到端模型研发力度,试图尽快上车,增加产品竞争力。

在周光看来,端到端模型不只是让汽车拥有效果更好的新版自动驾驶系统,因为汽车就是一种特殊的机器人,端到端模型也会是未来空间更大的通用机器人的基础,是 AI 2.0 时代的驱动力之一:“在端到端模型的基础上,有可能做出一套物理世界通用的人工智能系统。”

“端到端是自然而然的选择”

现在主流的模块化自动驾驶方案,优点是技术较为成熟,开发起来的确定性更强。但这种技术架构下,自动驾驶车辆在扩大使用区域、适应不同地区的道路和环境时会遇到阻碍:尤其是在规控环节,需要依赖工程师编写大量代码去制定行驶规则,以应对极端案例(corner case)。单靠数据训练出来的各个模块,它很难处理没碰到过的情况。

这会挑战自动驾驶系统的安全性。“每一个坑都需要用规则去填,但万一没填到,一个坑可能就是一次事故。” 一位 AI 从业者说。

编写大量规则也带来了极大的开发和维护成本。据了解,为了迅速扩大量产车上自动驾驶系统覆盖范围,华为的规控团队招募了上千名工程师。

“基于规则,必然会有一些情况处理不了,量产车有十万台、百万台,行驶的区域不同、道路不同,很难靠规则覆盖所有区域。” 周光说。

过去这些年,自动驾驶方案中的模块在持续变少:

- 2017 年前,开发自动驾驶系统需要 9 个模型,仅感知环节就要有 3 个,分别负责检测、目标跟踪和融合数据。

- 2017 年,自动驾驶方案模型减少到 7 个,3 个感知模块变成 1 个多传感器融合模块。

- 2022 年,自动驾驶方案的模型减少到 3 个,分别负责感知、预测和控制。

自动驾驶方案中的模块变得越来越少。

端到端模型是这一趋势的完成形态:只用一个模型就能完成自动驾驶任务。

在周光看来,如果相信数据驱动是大趋势,“端到端模型是一个自然而然的选择”。元戎启行从 2023 年初开始投入资源研发端到端模型,当年 8 月完成道路测试。

这次测试让他们看到了端到端模型的潜力。“基于规则的传统模型,核心指标是安全,然后才考虑乘客的舒适。而对其他道路参与者的感受并不在意。” 周光印象最深的例子是,一次测试端到端模型时,车辆要直行,但停在右转、直行车共用的车道上,堵住了后方要右转的车,模型发现前方还有路,就控制车往前开了一点,让后面右转的车先走,“就像一个老司机。”

但端到端模型 “下限很低”,如果训练不好,在安全、舒适等指标上,效果可能还比不上传统模型。这意味着,开发一款合格的端到端模型需要投入更多资源。

周光认为,由于端到端模型入局门槛高,未来几年,不同自动驾驶公司间的差距将会变得更大。

端到端模型竞争,比拼的是系统能力

想做好端到端自动驾驶模型,需要一套系统化能力,其中每个环节都有新挑战。

获得海量的行车数据,是训练端到端自动驾驶模型的入场券。特斯拉 CEO 埃隆·马斯克(Elon Musk)去年在财报会上谈到了数据对自动驾驶模型的重要性:“用 100 万个视频 case 训练,勉强够用;200 万个,稍好一些;300 万个,就会感到 Wow;到了 1000 万个,就变得难以置信了。”

并不是所有的行车数据都可以用来训练端到端模型。一位自动驾驶工程师说,他们训练端到端模型时发现,原本积累的路测数据只有 2% 可以用。想让端到端模型具备通用能力,必须用不同场景中的高质量数据训练模型。

周光告诉《晚点 LatePost》,元戎启行从合作车企那里获得脱敏数据时,会优先筛选出驾龄超过 6 年、3 年内没违章的司机在不同复杂路段的行车数据,采集他们方向盘的转角和速率,踩踏板的开度和速率,配合当时的行车环境训练模型。他说,元戎启行最大的优势是处理数据的能力,这是他们过去多年坚持开发数据驱动的量产自动驾驶模型积累下来的。

为了给模型打好基础,元戎启行把 80~90% 的精力放在数据工程上,包括但不限于采集、清洗、分类和标注高质量数据。

把海量的数据变成端到端模型,还需要大量算力。马斯克近期在财报会上说,为了训练更强的 FSD 模型,今年要花 10 亿美元采购英伟达、AMD 的芯片,组建超算中心。

周光说,元戎启行也为训练端到端模型采购了一批 GPU 搭建数据中心,训练模型时如果需要大量 GPU ,会去租赁云计算资源。在他看来,仅有算力也是不够的,而是怎么在训练过程中,尽可能利用好海量数据,做出来符合预期的模型。

模型训练出来后,并不能直接用到车上。因为用大量的数据训练出来的模型,参数会比较大,只有车上有高算力芯片才能带得动。但目前在售产品中,单芯片算力最高的自动驾驶芯片是英伟达 Orin,算力在 254 TOPS。而且车端自动驾驶芯片间带宽较小,很难并联使用以增加整体性能。

前不久马斯克在一场活动上说,FSD v12 的难点就在于,需要在有限的算力条件下进行优化、精简模型,要解决的问题又复杂了一个数量级。

周光称,他们精简后的模型端到端模型可以在 Orin 芯片上运行,如果用算力更强的芯片,比如单颗芯片算力达到 1000 TOPS 的 Thor,端到端模型的效果还会更好。他认为,作为第一批能把端到端模型与 Thor 芯片适配的公司,元戎启行会在这波浪潮中具备更多优势。

下一个赛点:机器人领域的 Scaling Laws

体会到端到端模型的效果后,周光重新审视了公司的发展路径。他认为,端到端模型的潜力,远不止让汽车实现无人驾驶,继续迭代下去,可能会做出物理世界的通用人工智能。

2023 年,元戎启行经历了成立 4 年来的战略调整:短期目标是,推动端到端模型上量产车,积累数据;长期目标是,找到一条通往物理世界通用人工智能的路线,实现 AGI in Robot。

虽然自动驾驶端到端模型也是用海量数据训练更大模型,实现更好效果。但与 GPT-4 这类大语言模型不同的是,训练机器人模型需要的不是规则简单的文字数据,而是从物理世界采集大量复杂的 “临界态数据”,即物体运动时,受物理世界影响,发生变化时的数据,如汽车在拥挤道路上行驶时,需要时不时调整速度和方向,这些运动行为会被采集下来构成一组数据。

当前大语言模型扩展时依赖的 “Scaling Laws”(比例定律)可能无法直接迁移到机器人大模型中。

OpenAI 研究者在 2020 年提出的 Scaling Laws,让研究者可以用少量数据训练小模型,较为准确地预测,随着大语言模型数据量、参数和训练所用算力的增长,模型性能会达到什么程度,解决大语言模型规模扩展的难题。

因为 Scaling Laws,大语言模型领域逐步形成共识:用更多 AI 算力和数据,训练参数规模更大的模型,效果会更好,甚至可以“涌现”出智能。

“在自动驾驶,或者说机器人场景,因为训练数据类型不同,单纯用更多高质量数据训练更大的模型,可能会遇到瓶颈,效果可能不会变好,甚至还会下降。” 周光说,机器人领域需要在模型架构上创新,找到它自己的 “Scaling Laws”,才能让模型效果有质的提升。

周光说,找到机器人领域的 Scaling Laws,就是元戎启行接下来几年的重点研究方向,这是实现公司长远目标,即 AGI in Robot 的关键。

到目前为止,还没有哪家公司提出了自动驾驶端到端模型,或者机器人领域的 Scaling Laws。

“特斯拉或许会有,但不一定会对外说。” 周光认为,AI 2.0 时代的竞争会更激烈,领先公司可能都会选择闭源路线,这是必须认清的现实。

题图来源:元戎启行


近年来,在国内形成了多个主要依托自身的主机厂以及具有一定实力和影响力的零部件配套企业,同时还拥有相关企业和服务支撑体系,成为业界有一定影响力的企业集团及产业链完整的产业集群。同时,在研发方面也在不断创新突破,积极探索新技术、新模式和新业态发展,加快在新能源汽车、智能化装备、高端材料等领域等方面取得实质性突破。

上一篇:剑桥科技:公司已完成多款400G和800G LPO产品研发工作
下一篇:时隔两年又出手,南京银行获外资大股东增持近8000万股!业内人士预判:未来或将继续增持
更多更酷的内容分享
猜你感兴趣
华为、蔚小理布局自动驾驶,未来10年内将批量迎来 端到端 自动驾驶元年

华为、蔚小理竞争激烈:‘端到端’自动驾驶大模型元年即将到来

华为、蔚小理布局自动驾驶,未来10年内将批量迎来 端到端 自动驾驶元年 华为、蔚小理竞争激烈:‘端到端’自动驾驶大模型元年即将到来

特斯拉Model S Plaid原型车北美测试,采用端到端模型处理感知信息,实现全局优化。国内主机厂和智能驾驶技术公司纷纷入局,其中小鹏汽车发布首个端到端产品XPlanner。该模型包含神经网络XNet和规控大模型XPlanner,以及大语言模型XBrain,能模拟人类感知,实现精准路线规划,减少操作失误。

热点资讯 06.14
自动驾驶技术:从‘端到端’迈向曙光之路?

自动驾驶技术:从‘端到端’迈向曙光之路?

中国有望年内推出特斯拉FSD V12.5,这是自动驾驶领域的一项重要进展,有助于推动整个行业的快速发展。小鹏汽车CEO认为,端到端大模型将缩短自动驾驶过渡到完全自动驾驶的时间,实现类L4级智驾体验。而轻舟智航CEO则认为,未来智能驾驶技术的发展趋势将更加注重数据驱动,系统将是一个模型而非传统的人工神经网络。

热点资讯 07.28
英伟达吴新宙宣布:自动驾驶将迈向端到端的阶段,目标在2026年实现L3级驾驶

英伟达吴新宙宣布:自动驾驶将迈向端到端的阶段,目标在2026年实现L3级驾驶

始,英伟达将加速推进AI定义汽车的发展,包括推出自家的DRIVE Thor超算力计算平台、推动行业标准统一以及开发汽车安全平台等。英伟达预计在2025年前,能够为超过100万辆车辆提供AI驱动的驾驶辅助功能,并计划通过深度学习和自动驾驶技术提升整体交通效率。吴新宙还强调,英伟达将继续与中国各大主机厂合作,共同推动AI定义汽车在中国的落地应用。

热点资讯 05.01
90后AI天才打造全球首辆端到端自动驾驶卡车,抢占自动驾驶行业先机

90后AI天才打造全球首辆端到端自动驾驶卡车,抢占自动驾驶行业先机

黄泽铧,ID为黄泽铧,是零一汽车创始人之一,也是图森未来的联合创始人。他在2020年参加AI顶会CVPR的国际自动驾驶挑战赛中名列第二,但在同年4月,由于零一汽车宣布其已经在新能源重卡领域开始了研发工作并取得了初步成果,成功参加了比赛。这表明零一汽车已经开始尝试向大规模商业化自动驾驶过渡,从而显示了其对端到端自动驾驶技术的信心。黄泽铧认为,端到端自动驾驶技术将推动自动驾驶商业化迎来真正的曙光,并预测L4可能不存在。然而,他也提醒称,零一汽车并没有首选自动驾驶的软件方向,而是选择了最前沿的端到端赛道。总的来说,尽管黄泽铧对自己的创业计划有坚定的信心,但同时也对全球自动驾驶市场的竞争保持谨慎态度。

热点资讯 10.15
2025年,行业有望迎来新一轮年度级别上涨行情:你的投资准备好了吗?

2025年,行业有望迎来新一轮年度级别上涨行情:你的投资准备好了吗?

中信证券预计2025年A股将经历一轮年度级别的上涨行情,中金公司则认为2025年结构性机会将进一步增多。然而,在当前市场环境下,机构仍然持乐观态度,认为A股还有较大的上涨空间。预计2025年A股盈利同比增速将从2024年的0.5%小幅上升至0.7%。建议投资者关注信用周期、宏观价格、A股盈利等领域。

热点资讯 11.23
一线城市全面取消非普宅标准,这对房地产市场有何影响?

一线城市全面取消非普宅标准,这对房地产市场有何影响?

广州取消普通住宅和非普通住宅标准,12月1日起施行。这是为了满足改善性需求购房者的需求。其中,普通住宅和非普通住宅的定义由各地标准决定,契税额也由不同区间规定。这次政策的实施将减轻购房者的负担,使得更多的购房者有机会购买到适合自己的房子。同时,也有利于房地产市场的稳定和发展。

热点资讯 11.23
权重股动荡,指数破3300寻求市场修复性机会

权重股动荡,指数破3300寻求市场修复性机会

电器等板块涨幅最大。 综合来说,本周市场呈现震荡探底走势,权重股低迷,但题材股活跃。对于下周,建议投资者关注政策面变化和成交量变化,控制好风险。具体操作上,可以关注调控政策的变化,以及行业基本面和业绩预告等信息。

热点资讯 11.23
电商出海:拉丁美洲市场解析与投资机遇

电商出海:拉丁美洲市场解析与投资机遇

疫情改变了消费者的购物习惯,拉美电商平台迎来快速发展,其中跨境电商卖家积极布局。据估计,预计2028年拉美地区电商市场规模将突破2050亿美元。虽然各国市场潜力各异,但有部分卖家已早早预见到这可能是一个难得的机遇,并开始在美客多等平台上展开竞争。

热点资讯 11.23
AI技术开启新篇章:搜索引擎市场的新一轮竞争风暴正在展开

AI技术开启新篇章:搜索引擎市场的新一轮竞争风暴正在展开

以下是一段关于AI搜索产品推出的新闻概述: 越来越多的互联网厂商推出AI搜索产品,其中最著名的是知乎直答、搜狗输入法和360集团。这些产品的推出反映了AI搜索技术的不断提升,预计在未来一段时间内,用户使用成本将会与传统搜索引擎相近。同时,它们也是对AI搜索逻辑与传统搜索逻辑差异性的突破,尤其是后者更关注场景侧的深入程度。尽管当前AI搜索产品仍存在用户习惯问题和产品升级需求等问题,但随着技术的发展和市场的需求,这些问题有望得到解决。在整体上,AI搜索正在改变我们的生活,并将继续推动数字化转型。

热点资讯 11.23
印尼欲求更多:苹果1亿美元投资仍无法解iPhone 16封杀令?

印尼欲求更多:苹果1亿美元投资仍无法解iPhone 16封杀令?

苹果面临印尼市场禁令困境,寻求解除或增加投资,可能寻求双倍回报。印尼政府希望能获得更大的投资,以换取其在手机制造方面的支持。

热点资讯 11.23
亚马逊海外官方旗舰店入驻京东:跨境巨头的激战升级还是新一轮较量?

亚马逊海外官方旗舰店入驻京东:跨境巨头的激战升级还是新一轮较量?

亚马逊海外官方旗舰店已正式入驻京东,旨在为全球消费者提供更多选择。亚马逊中国副总裁李岩川表示,他们将扩大采销、售前服务和支付方式的合作机会。同时,两家公司也将探索社交媒体电商和直播电商领域的投资和布局。

热点资讯 11.23
纳芯微王升杨:中国模拟芯片行业并购整合的必然趋势,你的浏览器可能需要更新一下

纳芯微王升杨:中国模拟芯片行业并购整合的必然趋势,你的浏览器可能需要更新一下

芯片制造商面临毛利率下降的压力。然而,纳芯微有限公司董事长王升杨表示,他有信心带领企业走出困境,走向更广阔的发展空间。他在采访中指出,在未来,中国芯片企业在市场竞争中将更加注重产品的定位和定义,以及与用户的深入沟通。此外,他也认为,当前的芯片行业正逐渐迈向稳健发展的阶段,关键在于企业的技术进步和创新能力。最后,他表示,中国汽车芯片产业将持续发展,为全球汽车行业注入新的动力。

热点资讯 11.23
苹果即将对Siri进行重大变革:发布会日期曝光!

苹果即将对Siri进行重大变革:发布会日期曝光!

苹果正开发更强大且具有对话功能的Siri数字助手,旨在赶超OpenAI的ChatGPT和其他语音服务。此新型Siri将采用高级的语言模型,支持双向对话,并且更精准地控制第三方应用。此项目已进行了13年,但仍然落后于Google的Gemini等竞争对手。苹果计划最早在2025年发布新的Siri,但确切日期仍有不确定性。此外,近期发布的招聘信息也显示,苹果计划推出更强大的Siri。

热点资讯 11.23
37岁导演再次开山之作:《庆余年2》演绎主角,他的新挑战引行业热议

37岁导演再次开山之作:《庆余年2》演绎主角,他的新挑战引行业热议

本文主要讲述了悬疑剧《宿敌》上线后引发的关注度,以及多个演员在其中的角色塑造。包括男主角廖凡、女主角黄萧、胡夏峰和国安警官肖波等,他们分别在剧中表现出层次感分明、立体饱满的人物形象和出色的表演。沈晓海作为一名熟知多年的老戏骨,在《宿敌》中的出色表现也受到了观众的一致好评。这些演员们在剧中共同营造了一个引人入胜的故事,并且展现出各自的特色和魅力。文章最后强调了这部电视剧的价值所在,呼吁更多优秀的影视作品出现。

热点资讯 11.23