一文看懂自动驾驶行业的今天和未来
2023全球自动驾驶峰会(GADS 2023)正式落下帷幕。
日前,2023全球自动驾驶峰会(GADS 2023)在深圳顺利闭幕,多位行业专家、自动驾驶企业代表、自动驾驶分析投资人士代表齐聚一堂,共同为自动驾驶行业的发展提出了各自的真知灼见。
本届峰会由智一科技旗下智能汽车产业新媒体车东西联合硬科技讲解与服务平台智猩猩主办,以「奇点将至 共赴繁荣」为主题,共设置了主会场会议+分会场论坛+展览+榜单四个环节。
在主会场上,15位嘉宾带来了14场主题演讲和致辞,并有3家创企CEO围绕大模型赋能、市场机遇等论题进行了深度对话。此外,峰会现场还揭晓了2023年度中国自动驾驶产业链先锋企业TOP50榜单,这是“AI生产力创新奖”系列评选中,面向自动驾驶产业的专项年度企业榜。
峰会吸引了来自全国各地的自动驾驶工程师、创业者、投资人积极踊跃参加,每个会场几乎都座无虚席,全网观看直播的人数近80万人。
▲峰会现场
清华大学计算机系长聘教授、博士生导师、清华大学人工智能研究院视觉智能研究中心主任邓志东教授对多模态大语言模型进行了报告,为本次自动驾驶峰会拉开了序幕。上海AI Lab浦驾OpenDriveLab团队也分享了其对于端到端自动驾驶的认识和发展思路。
整场会议也围绕大模型和自动驾驶进行了深入的讨论,主机厂和供应商都从各个角度带来了思考。
智己汽车从整车厂的角度分享了他们对于大模型车端量产化交付的实践与思考。
德赛西威、智行者、环宇智行围绕智能驾驶方案的量产和落地进行了分享,千挂科技则分享了商用车智能驾驶的落地实践与技术新趋势。凯芯科技也从高精度定位如何促进城市NOA落地和推广角度进行了思考。
吉利朗歌科技、昇启科技、恺望数据分别分享了高精地图、仿真、智驾数据对于NOA的发展和落地带来的帮助。
安谋科技围绕芯片设计和汽车智能化的发展提出了自己的看法,黑芝麻智能则分享了他们对于舱驾一体、跨域融合的最新思考和实践。
华兴资本集团分享了自动驾驶下半场的产业发展趋势及所带来的投融资机会。
而除了主会场15位嘉宾带来了分享,本次峰会还首次开设了两场分会场。在自动驾驶分析师论坛上,多位来自全球知名分析机构和投资机构代表对自动驾驶进行了多维度的分析;自动驾驶BEV感知技术论坛则聚焦到感知技术领域,多位青年学者和自动驾驶企业首席科学家同台对话,共同探讨了感知技术最新的进展和行业发展方向。
整个演讲过程中,多个自动驾驶产业大咖都抛出了非常有趣的观点,数次赢得观众的掌声,直播过程中也刷屏不断,火热的气氛将自动驾驶峰会的盛况推到了高潮。
那么,2023年智能驾驶行业究竟发生了哪些变化?2024年又该如何发展?智能驾驶最终应该如何落地?车东西详细梳理了主会场15位大咖分享的干货,看行业大咖如何为智能驾驶落地把脉。
01.
大模型驱动端到端落地
自动驾驶行业奇点将至
智一科技联合创始人、CEO龚伦常作为主办方代表进行了开场致辞,从自动驾驶行业角度介绍了峰会的背景。
▲智⼀科技联合创始人、CEO龚伦常
他表示,一方面,BEV+Transformer成为自动驾驶感知的主流范式,加上大模型又在仿真、数据标注、感知和预测等方面为自动驾驶赋能,汽车的智能化普及率快速攀升;另一方面,政策也在为产业提速,工信部等四部委联合发布的智能网联汽车准入和上路通行试点通知,将推动L3和L4在商业化与规模化以更快的速度迈进。
为此,第五届全球自动驾驶峰会围绕高阶智能驾驶、大模型应用、自动驾驶大算力、BEV感知技术等方向设置议程,并首次设置了自动驾驶分析师论坛,期望为行业的交流和技术发展尽一份力。
他同时透露,智一科技旗下在产业有广泛影响的IP峰会–全球自动驾驶峰会、全球AI芯片峰会以及生成式AI产业峰会,明年也将继续在北京、深圳、上海等地举办。
清华大学计算机系长聘教授、博士生导师、清华大学人工智能研究院视觉智能研究中心主任邓志东教授以《多模态大型语言模型助力自动驾驶产业落地》为主题的报告正式拉开了峰会的序幕。
▲清华大学计算机系长聘教授、博士生导师、清华大学人工智能研究院视觉智能研究中心主任邓志东教授
邓志东教授提出,多模态大语言模型是一种能够进行视觉感知和交叉理解的通用语言模型。它可以通过少量样本来实现视觉感知和交叉理解,不再需要大量标签训练。同时,通过多模态的方式可以实现对驾驶场景、自车、他车、道路交通元素以及它们之间关系的理解,从全局到局部,从局部到全局,并且可以将视频中的每一帧图像转换为文本并进行解释。
多模态交叉理解与知识推理可以实现从感知理解到决策规控的端到端化,其中多模态交叉理解指的是驾驶过程中图像、视频、点云、语音、文本之间基于人类语义的相互转换与对齐。我们可以尝试通过视觉语言模型来对各个环节进行连接,以此提升整个环境感知和决策规划系统的一体化认知能力与水平,而知识推理则可加强此过程。此外,通过多模态大型语言模型可实现对各种下游任务的适配,以便获得开放视觉词汇多任务零样本泛化能力,如零样本检测与零样本分割等,同时结合驾驶领域专业知识喂养与特定场景的数字孪生,进一步增强多模态大模型的准确性与泛化能力,并减小其幻觉。这些感知与认知技术的实际应用可望加速提升自动驾驶系统的智能化水平。
多模态大型语言模型不仅可增强NOA等L2++自动辅助驾驶产品的技术及市场竞争力,更可推动L3+与L4自动驾驶产业未来的大规模商业化落地,特别是单车智能的发展。同时运用AI大模型预测技术赋能一对多远程安全接管迭代,通过单车智能+智能路网的技术路径,构建可盈利的商业模式闭环,实现整车L3+的大规模商业化落地和中国方案的产业化创新引领。
上海AI Lab浦驾OpenDriveLab团队研究员陈立则聚焦于端到端自动驾驶领域,分享了他对该领域前景与挑战的思考。
▲上海AI Lab 浦驾OpenDriveLab团队研究员陈立
他先阐明端到端自动驾驶的定义,即通过输入传感器的数据,输出规划和控制的结果。
这种方案优点非常明显,比如融合所有的模块,是联合优化的结果,能够避免上游误差,它对于部署轻量化可能性也存在。
但端到端方面也面临很多问题,最突出的就是评测问题,现在最好方式是闭环评测,但闭环评估仅适用于模拟器/机载测试,消耗人力物力,同样也缺乏可解释性,这导致了端到端方案没有模块化方案那么好的性能。
那么端到端方案如何能够最终落地?
陈立表示,他们团队也曾设计过非常简单的模仿学习,基于专家网络训练子网络,比如TCP工作,但其在实际中具有不可解释性的问题。随着时间的发展,端到端的模型设计越来越复杂,性能也越来越好。他们在UniAD工作中基于Transformer架构做了融合和设计,进行感知、预测、规划等多模块信息融合,实现更好的规划性能与优秀的可解释性。
在最后,陈立也讲述了另一种可能的落地方案,他认为可以让Student Model只学感知部分,把感知的结果喂给训练得很好的、因果推理能力也很强的Teacher Model,实现高效训练。解耦感知和决策两个部分之后,就具备了很好的因果推理能力,也具有模块化的训练优势。
陈立表示,他们希望有一个非常通用的模型,基于大量已有数据与生成数据训练,使其在自动驾驶或者具身智能任务里面发挥作用。
德赛西威智能驾驶传感器事业部负责人江伙红分享了企业在场景驱动下对智能驾驶商业化实践与思考。
▲德赛西威智能驾驶传感器事业部负责人江伙红
江伙红提到,智能驾驶行业正在迎来变革,包括技术革命推动汽车产业变革、购车主力人群对智能驾驶需求增加、政策法规支持以及智能驾驶面临的挑战、高阶智能驾驶面临信任度挑战。
德赛西威从组织架构与商业模式、产品和产业落地三个方面进行思考。在组织架构和商业模式方面,德赛西威强调以用户体验为中心,联合研发开放合作,与客户共同成长,改变行业以往“一锤子买卖”的形式,为车企提供专业的软硬件解决方案。
在产品角度上,德赛西威提供全栈自动驾驶解决方案,包括智能驾驶域控制器和传感器解决方案,满足不同层级车型的智能驾驶需求。智能驾驶未来的发展趋势是大数据和大算力带来更好更安全的体验。
智行者科技联合创始人、研发中心副总经理张放分享了智行者在全场景行泊越一体智能驾驶方案上的技术思路和量产成果。
▲智行者科技联合创始人、研发中心副总经理张放
张放表示,一些主机厂对越野场景有非常大的诉求,因此把越野场景纳入了行泊一体方案中。
他总结了新能源车主的主要购买因素。首先,新能源车消费者对价格相对不敏感,弱化尺寸、动力、配置等因素,看重算力、传感器配置。其次,续航水平仍为消费者购买电动车的主要考量因素,但消费者对续航关注度与里程焦虑显著下降。最后,智能化和自动驾驶的关注度与偏好日益显著,成为吸引消费者购买车辆产品的主要因素。
目前,L2级辅助驾驶正在进入市场红利期。特别是2023年可以称作城市NOA元年,大多车企都公布了城市NOA开城计划。
但是在实地落地过程中还是有很多问题需要解决,用户体验使用效果不如驾驶员,适用范围受限,接管次数偏多,性价比不高。
为此,智行者打造了数据驱动的全场景行泊越一体的解决方案,包括AVOS自动驾驶软件平台、AVCU自动驾驶中央计算单元、AVDC数据闭环平台。
此外,张放表示,大模型的潜在能力可以充分运用业务中。数据生成方面,可以低成本生成各类场景、各类目标和各种天气情况的数据,包括Corner case等数据。 数据标注层面,大模型可以用于数据自动化标注或者根据已有标签生成新的场景数据。传感器适配上,大模型可以用于量产过程中sensor改变,给定一批目标sensor数据训练,可将旧数据转变成新sensor的数据。闭环仿真层面,利用world model的传感器仿真和基于地图等生成数据的能力可以实现从传感器到控制输出的闭环仿真。
千挂科技联合创始人叶璨以卡车为切入点,介绍了商用车智能驾驶的落地实践与技术新趋势。
▲千挂科技联合创始人叶璨
千挂科技的自动驾驶技术涉及感知预测和AD大模型两个方面。感知方面,通过一个大模型感知所有相关的任务,使用多传感器和多模态的融合来解决高速场景的挑战。智驾大模型方面,他们使用点云和图像进行特征融合,完成各种感知相关的子任务,如障碍物检测和分割等。通过硬件和算法确保感知距离达到300~500米。
千挂科技还进行了多模态预训练,旨在获得自动驾驶场景下多模态的泛化特征。他们通过点云和图像匹配的多模态数据训练整个网络,并对模型进行微调。他们还使用互联网数据和自动驾驶数据进行联合微调,以提高训练效果和稳定性。这有助于识别自动驾驶场景中的长尾物体,如异形车和遗洒物。
千挂科技利用大模型进行数据闭环,通过挖掘高价值的长尾数据来优化模型,并利用端到端技术实现数据的规模和效率提升。他们的端到端算法AutraFlow是一个完全Learning化的架构,可以在车上运行并应用于产品和业务中。
华兴资本集团华兴证券董事总经理、硬科技团队负责人阮孝莉作为主会场唯一投行视角,分享了自动驾驶下半场的产业发展趋势及所带来的投融资机会。
▲华兴资本集团华兴证券董事总经理、硬科技团队负责人阮孝莉
首先从市场层面,借用技术采用生命周期理论,结合自动驾驶的渗透率来判断,整体自动驾驶行业正处于跨越鸿沟的阶段,也即将进入高速成长的下半场。新玩家进入难度加大,现有玩家加速破局。
接着从政策层面,她对2023年11月四部门联合印发的《关于开展智能网联汽车准入和上路通行试点工作的通知》进行了重点解读。这是首次在国家层面以试点形式推动L3/L4级别自动驾驶商业化落地,在需求端能够提振用户信心,在供给端也能带动新一轮技术研发和产品投放周期。
市场叠加政策双重驱动下,城市NOA渗透率持续提升、中高端车型搭载高阶自动驾驶将是两大确定性趋势。往前看,感知层、决策层、执行层等零部件层面与解决方案商层面均将受益于自动驾驶发展浪潮。
对此,阮孝莉分享了在投融资方面的机会判断。在感知层,单车搭载传感器数量持续增长,多传感器融合是大势所趋。其中,摄像头领域更多是国产替代的机会。毫米波雷达建议关注技术革新过程中成长起来的,像加特兰等技术水平比肩全球的企业。激光雷达的成本优势是竞争关键,规模化量产和技术迭代会带来价格的持续下探。
在决策层,随着自动驾驶量产迈入深水区,国产芯片市场份额快速提升,建议关注国产芯片商的算力等性能指标与定制化、个性化的算法开发能力。在执行层,自动驾驶推动线控底盘发展,核心模块自主供应商迎来发展机会,像蜂巢转向是国内稀缺的中高端转向产品供应商。在通信层,更高效的车载以太网加速渗透,建议关注以太网连接相关硬件的机会,例如国内首家量产千兆级车规PHY芯片的景略。
在解决方案商层面,规模量产能力与技术迭代能力是解决方案商的竞争关键。对于传统主机厂、传统Tier1、科技巨头等来说,收并购可以快速补强智能化短板与增强系统方案能力,并购整合潮有望持续加剧。
02.
2023年度中国自动驾驶产业链
先锋企业TOP50榜单正式公布
在几位嘉宾进行分享之后,智⼀科技联合创始⼈、总编辑张国仁正式公布了2023年度中国自动驾驶产业链先锋企业Top 50榜单。
他表示今年是自动驾驶行业近十几年来最重要的一年,政策方面两条重磅政策为L3、L4自动驾驶商业化指明了方向,高阶智能驾驶技术有了进一步的政策支持。大模型的技术爆发也给自动驾驶发展提供了新的思路。市场对自动驾驶的接受度也逐渐增加,自动驾驶产业链也越来越完整和强大。
▲智⼀科技联合创始⼈、总编辑张国仁
华为、小鹏等企业开始利用大模型技术布局高端智能驾驶,市场层面,经过过去几年的发展,市场对自动驾驶的接受程度也逐步提升,L2+以下的自动驾驶普及率已经达到50%,这是行业发展非常重要的临界点。
如果站在更长时间的维度来看,今年将是自动驾驶发展中非常重要的一年,在这一年我们看到国内自动驾驶产业链越来越完整和强大,从传感器到芯片、从配套的数据到云服务,再到完整的落地方案,一批产业链企业得到蓬勃发展,在技术创新的征程上越来越远。
自动驾驶行业的发展离不开产业链每一个公司的贡献,自动驾驶又是打造新的出行方式基石,也是一个充满生机和大有作为的产业,更是中国科技力量引领世界的机会,祝愿更多智能驾驶产业链公司在自主创新的道路上结出丰硕的果实!
在这样的背景下,2023全球自动驾驶峰会设立了2023年度中国自动驾驶产业链先锋企业榜单,希望对引领技术创新研究、走在落地赋能前列的中国自动驾驶产业链公司及创业新秀予以展示。
而在峰会上,张国仁也正式公布了最终名单,分别是阿维塔、安谋科技、AutoX、百度Apollo、北醒、滴滴自动驾驶、大疆车载、地平线、德赛西威、禾多科技、后摩智能、毫末智行、禾赛科技、火山引擎、华为、黑芝麻智能、觉非科技、旷视科技、恺望数据、凯芯科技、理想汽车、MAXIEYE、Momenta、美行科技、魔视智能、宁畅、Nullmax、千挂科技、轻舟智航、如祺出行、昇启科技、速腾聚创、商汤绝影、四维图新、探维科技、腾讯云计算、蔚来汽车、文远知行、芯驰科技、希迪智驾、小马智行、小鹏汽车、易航智能、元戎启行、嬴彻科技、驭势科技、智加科技、智己汽车、知行科技、智行者。(排名不分先后,按公司简写首字母排序)
▲2023年度中国自动驾驶产业链先锋企业榜单
03.
智驾“iPhone时刻”将至
出海正当时
在上午场的最后,多位行业人士关于“大模型如何重构自动驾驶”这一话题进行了一次深入讨论。
▲⾼端对话:大模型如何重构自动驾驶
对话由五源资本合伙⼈刘凯主持。极佳科技创始⼈、CEO⻩冠,昇启科技创始⼈、CEO孙琪,恺望数据创始⼈、CEO于旭参与了对话。
针对大模型对自动驾驶行业的启发和借鉴的问题,黄冠认为,相信大模型会深刻影响自动驾驶,未来将颠覆整个自动驾驶行业。传统的感知、预测、规划的适配过程很麻烦,视觉感知大模型发展可能会出现通用智驾大模型。
于旭表示,大语言模型可以为自动驾驶带来端到端的曙光,未来还能让大语言模型赋能数据生产线,促进BEV等量产落地。孙琪则认为,大语言模型将推动智驾智舱融合,提升人机交互效果。大模型还将赋能智驾数据挖掘处理工作,未来可能会赋能云端数据处理。
而针对大模型是否会让“iPhone时刻”提前到来的问题,三位嘉宾也发表了自己的意见。
整体上来看,三位嘉宾对于这一趋势非常认可,只是对于时间的考虑略有不同。
黄冠认为最快1年,最慢2~3年,自动驾驶行业将迎来“iPhone时刻”,目前数据、算力、算法、人才、需求等条件都具备了。于旭也认同这一观点,她还提到,自动驾驶开始往量产的方向走,现在大语言模型也是某种技术的变革,这种变革在强需求的情况下会加速智驾迭代。
而孙琪则觉得智驾的“iPhone时刻”会更快一些,特斯拉FSD V12就有类似效果。拥有算力、算法和数据的企业将具备发起“iPhone时刻”的机会。
在目前的自动驾驶行业中,既有一些布局已久的大公司,也存在一些初创新秀,两方面势力共同促进行业发展,又彼此形成了竞争。
那么在这样的环境下,应该如何保持竞争力呢?
黄冠认为创业要么把一个点做到极致,和整个产业链合作,要么就结合技术变革来做。目前中国还是有很好的创业机会,因为中国整个需求和应用非常成熟。下一次驾驶的变革不是驾驶公司带来的,是大模型公司带来的,可能是OpenAI或者特斯拉。
于旭认为自动驾驶行业一直有创业机会,早期提供智驾方案,往后可能更聚焦在工具层面上的支持,侧重点不同但是机会一直有。大公司规模化的成本高一点,白热化的竞争更激烈,小公司机会规模相对少一点,但是它的卡位会成为关键。
孙琪则认为各企业是在产业链上的分工,是合作的关系。大公司可以做好集成,小公司可以做好环节。
当下的智能驾驶领域,出海也是行业讨论的一个大的话题点,针对这一问题,黄冠、于旭、孙琪都认为中国的产业投入和积累对外有一定的竞争优势,中国企业出海拥有很大的机会,但也需要做好出海的本地化适配。
04.
轻高精地图和视觉智驾方案崛起
端到端成趋势
下午的主会场由高阶智能驾驶专场、大模型专场和自动驾驶算力专场三个专场组成,8位嘉宾分享了各领域的最新发展成果和趋势。
高阶智能驾驶专场上,吉利朗歌科技CEO助理兼智驾中心负责人李战斌,凯芯科技芯片产品负责⼈张迪,昇启科技创始人、CEO孙琪对高阶智驾落地前景和趋势展开了分享。
吉利朗歌科技CEO助理兼智驾中心负责人李战斌分享了《智驾高精地图的困局与创新》。
▲吉利朗歌科技CEO助理兼智驾中心负责人李战斌
李战斌提出,自动驾驶行业苦“高精地图”久矣,高精地图面临制作和审图周期长、更新成本高、覆盖度有限等痛点。
对此,朗歌科技推出了周天数据智能体系,打造面向智能驾驶的新一代智驾地图。该地图具备更新快、地图元素最高周天级更新,质量高,可量产等优势。
李战斌表示,朗歌科技的目标是3年内让单公里地图价格在100块钱以内。
朗歌把智驾地图分成4个图层(智驾ODD图层,智驾地图经验层,智驾地图更新层,智驾地图基础层),遵循ODD运营图层配置开放、核心要素分钟级在线生产与端侧更新、智驾经验图层与智驾伙伴合作共建、道路环境信息动态发布、城高一体的智驾地图规格、驻场贴身服务,快速推进业务落地的建设思路。
而在量产上车方面,朗歌智驾地图的一体化引擎,能够同时支持HD&HDLite数据规格,接口层无需重复适配,还能同时支持城区和高速数据播发,支持高速和城区一体化NOA,三明治引擎架构在3周时间,与智驾公司实现城区与高速的一体化NOA实车路测。
在更新速度上,朗歌智驾地图的更新方式从专采向众源过渡,更新频率逐渐提升。
李战斌还介绍了朗歌科技的真值数据服务的价值及优势,其服务基于高精地图数据的自动化标注,快速、批量生产BEV真值数据,助力主机厂缩短智驾开发与落地周期。
另外,朗歌智驾真值服务还提供了全自动化真值数据生产工具链,助力客户快速冷启动及算法模型持续迭代。
此外,李战斌还表示,朗歌智驾地图不仅仅用于真值生成,还用于构建仿真系统的道各种路环境生成,来提升智驾的落地速度。
在峰会上,李战斌还介绍了朗歌科技周天数据智能体系之智算大脑:具身多模态地图大语言模型。李战斌强调该模型的重点是具身能力,将海量的吉利体系、自研采集、三方数据等众源环境数据,经周天智算大脑具身大语言模型进行数据与地图间的环境交互式生成,这样智算大脑高自动化的生成智驾汽车视角需要的智驾地图,迭代更新人类视定义制作的高精/高辅地图,结合机器的博弈和强化学习等优化智能及仿真系统出品校验等,帮车企更快落地智驾系统。
凯芯科技芯片产品负责人张迪在会上分享了车规级高精度GNSS RF-SoC芯片KT5030A,介绍了其在原始观测量、开放的高性能处理器平台、功能安全、安全策略、抗干扰、防欺骗等方面的优势。
▲凯芯科技芯片产品负责人张迪
张迪提出,高精度定位是自动驾驶感知的基石,自动驾驶面临恶劣气候(传感器使用受限)、复杂路况(环境特征多变,影响传感器工作)、城区驾驶(道路狭窄,精度要求高)等挑战。而高精度定位芯片能够提供厘米级绝对位置信息,全天候定位、降低系统算力开销、提供冗余能力。
KT5030A已通过AEC-Q100 Grade2 车规认证,可在105℃苛刻环境下稳定工作,且具有专业级GNSS接收测量引擎,具备国际领先的频点信号支持能力,能够同时对天上所有可见卫星的全部频点信号进行接收处理,并支持全部的星基增强信号。KT5030A能够提供行业领先的原始观测量,除能够支持L1和L5频段外,还能支持到L2和L6频段,收星数总量远高于竞品。
张迪提到,KT5030A在国内高精度行业内首先开放高性能应用处理器,用户独享该应用处理器,进行算法的二次开发,并提供完善易用的工具链,包括SDK开发工具和硬件开发平台,帮助客户快速完成市场导入。
KT5030A还设置了多维度的安全策略,提供可信的应用和开发环境,通过设置签名检查可实现安全启动,并通过加解密策略实现用户软件的IP保护,降低密钥泄露风险,保护第三方的价值。
在功能安全方面,KT5030A提供冗余的原始观测量输出方案,支持观测量质量校验矩阵,支持PVT Protection Level置信度指示,并提供心跳指示接口,通过功能安全MCU,可以对GNSS设备状态进行监测。
KT5030A还具有先进的防欺骗抗干扰性能,能够抵御高强度的干扰信号并有效抵御欺骗,在城市峡谷、林荫路、高架桥等场景中展现出优异的定位性能。
张迪表示,KT5030A是业界最小尺寸高精度全频点GNSS SoC芯片,在集成度、性能、功耗,尤其是开放度等方面处于领先地位,凯芯科技将提供高性能、高性价比并且灵活的高精度定位技术平台,从底层赋能客户,与行业伙伴实现共赢。
昇启科技创始人、CEO孙琪进行了在数据闭环与端到端自动驾驶方面的分享。
▲昇启科技创始人、CEO孙琪
孙琪表示,现阶段“实车测试+专家规则”的开发模式无法实现高阶自动驾驶。要想在有限时间和成本内积累高阶自动驾驶所需的海量测试里程,仿真是唯一的途径,并通过大模型技术为测试开发过程赋能。
传统自动驾驶测试只能预设路线或者简单的响应式行为模型,无法模拟强交互、强博弈场景,只能通过大规模路测验证算法,成本高、迭代速度慢。
昇启科技则提出了针对性的解决方案,通过多智能体博弈、对抗学习,驱动智能体自我进化,并推出了AI赋能的自动驾驶开发测试平台,实现这一功能。该平台由两个数据飞轮组成,一个飞轮通过自动驾驶仿真平台实现多智能体交互,另一个飞轮驱动AI引擎实现端到端的训练,从而形成自动驾驶研发的“端到端+数据闭环”。
▲AI赋能的自动驾驶开发测试平台
端到端+数据闭环相较于专家规则+回灌测试呈现明显升级,首先在研发模式上不再基于人工设计规则系统,而是通过设计任务目标,自主训练驾驶策略。场景覆盖度上,基于无限场景测试,通过AI模型随机交互,模拟真实路段行为,场景覆盖度更高。测试效率上,可以实现数万辆车多任务并发,效率更高。迭代模式上,以秒为单位迭代模型,实时更新参数,迭代速度更快。
这样一来,能够将几辆车、单任务、有限场景跨越式地提升到数万辆、多任务、无线场景的仿真量级,摆脱“手工作坊式”的专家规则系统,实现全自动端到端模型的自主升级路径。
05.
大模型深度赋能数据训练
量产上车在路上
大模型专场上,智己汽车软件高级经理殷玮,恺望数据创始人、CEO于旭对自动驾驶相关大模型进行了拆解分析。
智己汽车软件高级经理殷玮分享了大模型车端量产化交付的实践与思考。
▲智己汽车软件高级经理殷玮
殷玮指出,2015年之前是传统汽车业的领域质量为先,对敏捷要求不高。2015年互联网造车进入后,对质量和敏捷都有较高要求,预计2025年迎来第三个阶段,即智能汽车与大模型融合的阶段。智驾发展从可控性走向可扩展性,而大语言模型则相反,两者将统一并探索AGI的雏形。智驾与大语言模型的发展方向不同,智驾更注重可控性和泛用性。
殷玮认为,智能驾驶领域采用了时序数据、地图、矢量SIL平台和4D标注等技术来提高模型的认知等级。此外,还采用了语言大模型、多模态大模型、多模态的异常工况和低概率工况的数据生成以及渲染级的仿真系统,利用知识驱动的提示词工程来生成样本,处理低概率和极限工况。通过这些技术的应用,希望能够实现更高层面的认知能力。
在域控架构下,大模型和集中架构都有各自的优势。如果只讨论规则算法或分体的AI模型,域控架构带来的收益未必弱于集中架构,甚至可能更有优势。目前来说,真正意义上的大模型在集中化架构上进行单体设备的集成还不现实,但基于“域控+SOA”级别的中模型已经具备了量产价值,可能在车端比大模型的价值更大。
大模型在车端应用和GPTS一样,是一个认知阶跃的过程,需要多个要素配合智驾模型的提升,包括特征维度的提高以及多模态异常工况数据生成和渲染级仿真系统的应用。在智舱和智驾之间的集中化架构调整中,模型也在逐步向域控化整合和服务化差异化发展。目前,这些大模型的应用仍处于初级阶段,但未来有望实现差异化的优势。
恺望数据创始人、CEO于旭带来了她在如何又快又准的训练“自动副驾驶”方面的思考。
▲恺望数据创始人、CEO于旭
于旭表示,要为自动驾驶提供超级快的服务。她从以下几方面介绍了恺望的具体措施。
第一是服务速度要快,恺望正在打造自动化AI数据产线,提供一站式AI数据。第二是团队要快,打造技术+运营的全链路人才。第三是爬坡期要快,实现快速突破。于旭介绍了行业头部主机厂的需求订单,“200页文档,恺望仅用了两周的时间完成了数据的审核,而借助大模型,两天的时间也达到了同样效果”。
第四是工具落地要快,恺望使用了易于集成第三方工具的平台,方便各类场景集成。第五是订单量和客户量的增长要快,恺望成立仅一年,月订单额就突破了1000万+,由于服务速度和工具落地的“快”,供应价格有能力相较业内降低20%。
于旭还介绍了不同的驾驶位有不同的训练方法,对于自动副驾驶来说,训练前要找到最适合训练副驾驶的人并配备高效率的工具链,训练中要快速对副驾驶的输出进行评测,训练后要帮助副驾驶适配应用场景。于旭也表示,大模型时代开发门槛降低,但对场景的理解和数据梳理的需求变高。
最后,如何又快又准的训练“自动副驾驶?”于旭用了一句话归纳,训练前,找人才,训练中,提销量,训练后,做场景。
06.
缓解算力焦虑
推动智能汽车快速落地
自动驾驶算力专场上,安谋科技汽车业务线业务发展与方案总监曾霖、黑芝麻智能芯片和架构副总裁何铁军、环宇智行CEO曹晶分享了自动驾驶算力平台所面临的问题和解法。
安谋科技汽车业务线业务发展与方案总监曾霖在会上发表了题为《高性能融合计算IP平台加速智能车芯发展》的主题演讲,分享了安谋科技在汽车电子领域的技术积累与市场优势,以及通过打造高性能融合计算IP平台,推动智能汽车“芯”发展。
▲安谋科技汽车业务线业务发展与方案总监曾霖
曾霖表示,汽车市场是持续增长的单一大市场,年销量稳步上涨,行业数据预测2024年中国汽车总销量将达3000万辆左右,消费者对新能源汽车的兴趣也在不断升温,从需求端为智能汽车芯片发展提供了有力支撑。此外,随着汽车行业的电子电气架构变革日趋深化,多域到中央计算成为趋势,对芯片厂商提出了更高的要求。
安谋科技依托于自研的高性能计算平台,将CPU、NPU、SPU、VPU等计算单元进行智能化融合,并结合领先的Arm IP 技术,为本土汽车电子市场提供多元化、定制化的产品及解决方案,满足智能驾驶和智能座舱的不同需求,在为车载芯片开发带来灵活性的同时,也能从功能、质量、开发时间和成本等方面提供明显的优势,全方位赋能国产智能驾驶技术的高质量发展。
曾霖提到,过去一台平台车型从立项到上市可能需要五年以上时间,而现在,国内已有主流车厂只需两年(即24个月)就可以推出一款新的品牌车型,甚至还有些Tier1主机厂商开始积极调整内部组织结构,以争取将新车研发周期缩短至12个月。在此背景下,安谋科技凭借精准的前瞻性眼光和丰沛的工程技术资源,通过并行开发和虚拟化设计等方式,帮助汽车芯片厂商有效节省研发时间和成本,使其可将宝贵的研发资源投入到能够打造差异化的地方。
在生态方面,安谋科技也在积极开展生态伙伴计划,携手上下游产业伙伴共同促进中国智能计算生态的创新和繁荣。
黑芝麻智能芯片和架构副总裁何铁军也分享了新一代智能汽车跨域计算芯片的应用能力。
▲黑芝麻智能芯片和架构副总裁何铁军
何铁军表示,智能汽车“智能化”面临的三大挑战和矛盾,分别是性价比、个性化、易用性。
为了实现软件定义汽车,针对不同客户群和产品形态定义不同的产品需求,同一硬件平台实现不同的差异化配置,为用户提供差异化的功能体验,芯片作为硬件平台的核心,对计算芯片的性能、架构灵活性、性价比都提出了更高的要求。
对此,黑芝麻智能研发了两条产品线,一个是面向高阶自动驾驶的华山系列,另一个是面向跨域计算的武当系列。其中,作为一款“All in one”的芯片,C1200主打多域融合和跨域计算,单芯片覆盖智能车核心场景,涵盖智能驾驶、智能座舱、智能网关、域控MCU,支持舱驾一体,真正做到“一芯多域”。其独立ASIL-D MCU满足高性能实时算力需求,此外基于Gen1.5 DynamAI NN神经网络处理器,计算效能较上一代提升超过50%。
C1200能为中国本土Tier1和主机厂提供兼具高性价比和高价值的NOA智能驾驶方案,加速舱驾一体商业化落地。目前,C1200已经完成流片后的完整测试,功能性能验证成功,已经开始给部分客户送样。
何铁军表示,黑芝麻智能通过不断技术创新,为行业伙伴提供多样化方案,解决性价比、计算能力的焦虑。未来黑芝麻智能还将继续和行业伙伴一起,持续赋能汽车行业。
在峰会最后,环宇智行CEO曹晶介绍了智驾技术中的智驾域控和算力平台从哪些需求出发来解决规模化量产问题。
▲环宇智行联合创始人、CEO曹晶
曹晶认为,当前智驾技术正朝着软件主导和硬件集约的方向发展,产业链重心从一体化智驾方案供应商向视觉和算力芯片硬件供应商以及数据和软件供应商转变。
环宇智行已经培养了跨平台、跨SoC的能力,并积累了多款SoC的域控制器方案。其平台提供感知、融合、预测、规划、控制算法等功能,并提供多源传感器数据的一毫秒时空配准,还能实现不同传感器数据的融合。
智驾技术还需要异构多核架构和算力平台+模型部署来支持各种功能需求,同时满足数据周转、法规要求数据安全、corner case挖掘等方面的要求。目前,环宇智行已经提供了系统级数据采集解决方案,并积累了APA和NOA等场景的实车测试经验。
在端到端视觉处理方面,环宇智行认为可以借鉴手机ISP提升图像质量方面成功的研发方式和产品经验,提出可以在SoC中加入AI-ISP小芯片来提升图像性能,降低智驾算法对算力的需求。此外,针对corner case场景,环宇智行提出利用AI-ISP前处理芯片来处理暗光等场景,降低SoC上感知模型的任务复杂性,扩展智驾算法在各种corner case场景的覆盖。
07.
结语:政策大模型赋能行业
自动驾驶奇点将至
今年,自动驾驶行业在政策和技术赋能下有了新的改变。政策方面,两条重磅政策为L3、L4自动驾驶商业化指明了方向,高阶智能驾驶技术不再是“空中楼阁”,高阶智驾落地有了进一步的政策支持。大模型的技术爆发也给自动驾驶发展提供了新的思路,或将彻底颠覆智驾发展方向。同时,市场对自动驾驶的接受度也逐渐增加,自动驾驶产业链也越来越完整和强大。
在这样的行业背景下,自动驾驶全产业链生机勃勃,蕴含了巨大的动力和能量。在峰会现场各领域各方向的大咖分享下,我们可以看到,自动驾驶行业将在不久的未来向更高层级发展:城市NOA功能正在落地,L3级别自动驾驶也在路上,全自动驾驶也并非是遥不可及的理想。
可以说,自动驾驶正在由落地向高层级高水平发展,自动驾驶行业的奇点将至,你我将共同见证。
原创文章,作者:王昊达,如若转载,请注明出处:http://damoai.com.cn/archives/2972