华为乾崑打响第一枪!辅助驾驶迎来“类人”到“超人”的跨越

B站影视 电影资讯 2025-08-28 12:38 2

摘要:从2021年Transformer被引用在智能驾驶上开始,整个行业迎来突飞猛进的发展,随后BEV、占用网络、端到端等技术相继出现,智能驾驶可以说是一年一跨越。

从2021年Transformer被引用在智能驾驶上开始,整个行业迎来突飞猛进的发展,随后BEV、占用网络、端到端等技术相继出现,智能驾驶可以说是一年一跨越。

在底层逻辑上,智能驾驶技术大概经历了2个阶段:

规则依赖阶段:“if 红灯 then 停; if 绿灯 then 行”的规则代码。这个阶段最大的问题是场景太多,无法穷举,只能在有限ODD里面Demo运行。它可以理解为智能驾驶的「木偶时代」,无泛化能力,遇到工程师没考虑到的场景,就直接卡BUG;

神经网络阶段:AI网络化,通过给模型喂人类司机数据,模仿学习开车,类似AlphaGo,学习人类棋谱,但人类司机数据有2个问题:实际路采效率低、成本高:开很长时间也碰不到一次危险场景,白忙活;劣质人类驾驶数据:各种路怒症开车的驾驶习惯并不值得学习。

这个阶段有点类似「猿人时代」,脑容量有限,有智能但不多,有简单的模仿与一定的泛化能力,但是野蛮生长,可以学好也可以学坏,不受控;

2021年-2023年左右,人类的自动驾驶停留在规则依赖阶段;2023年以后,整个行业进入神经网络学习阶段。但行业被困了2年迟迟没有突破。

然而,这一窘境即将被打破。原因是华为乾崑宣布了两件大事:华为乾崑智驾搭载量突破100万;今年9月份,华为乾崑智驾ADS 4即将陆续推送。在ADS 4上,华为乾崑创造性地提出了WEWA架构。

100万搭载量包含了丰富的corner case数据,配合WEWA架构的云端世界引擎和车端世界行为模型,将彻底改变智能驾驶的底层技术逻辑。这让整个行业正式迎来“AlphaGo时刻“,智能驾驶真正从“人类模仿学习”进入“AI自主进化”。

从华为乾崑WEWA开始,自动驾驶正式跨入一个全新的台阶:AI模型化+云端仿真+强化学习。通过给模型喂 “人类司机数据+AI仿真数据”+“强化学习”牵引,让AI模型见多识广。让模型的能力真正从“类人”到“超人”。

这个阶段的智能驾驶也正式跨入「智人时代」。脑容量变大,智能大幅提升,自己开自己学、从模仿人类到超越人类,并按人类的规训与社会伦理开车。

而这一切的底层技术支持都要从华为乾崑WEWA架构的2个特点说起。

云端世界引擎(WE):仿真数据+人类数据+强化学习,让老司机始于起跑线

智能驾驶数据分很多种,一种是比较常规的驾驶数据,比如你从家到公司的行为数据,这种对模型帮助不大;另一种就是特殊场景数据,比如大型复杂十字路口,或者急刹急停,cut in等数据,业内俗称corner case,这个对模型训练帮助非常大,但获取难度也大,而且需要付出巨大的成本,有时候甚至是车毁人亡的惨痛代价。

很多企业宣称的数据大部分都是第一种。过去行业为了获取一些corner case场景数据,人为设置各种障碍然后测试采集,但是成本高,效率低,而且能够涉及的场景有限。

华为乾崑智驾ADS 4 WEWA架构里的云端世界引擎(WE),重点解决的就是这个问题。

WE可以理解成一个云端运行的World Engine世界引擎。利用扩散生成模型技术,能够高可控地生成各种平时人类司机开车很少遇到的难例场景,比如侧前车Cut-in、红绿灯路口、宠探头、前车急刹等多种场景及组合场景。

要构建这样一套逼真的物理世界模型并不容易。华为乾崑自研了仿真工具,并且具备充沛的云端算力。这一点很重要,华为具备软硬件的全套自给自足能力,很多企业即便有这个意识,也不具备这样的底层实力支撑。通过打造“数字风洞”,华为乾崑直接将现实世界的难例密度提升1000倍。日常数据就像咱们高考的时候天天刷的常规题,但华为乾崑的WE自己生成附加题,然后训练模型,让AI训练AI,类似让AlphaGo与AlphaGo对战,产生更强大的Alpha Zero。

截至2025年4月,华为乾崑已经在世界引擎里进行了6亿公里的高速L3仿真验证。

还有一点需要特别强调的是,为了引导模型的正向发展,WE还设置了“安全优先”的强化学习原则,如同设立了一个奖惩监督员,“安全优先”给奖励,“忽略安全”给惩罚,让模型时刻牢记“安全第一”基本法则。这就像是在孩子很小的时候给他树立一个正确的价值观,做坏事就惩罚,做好事给奖励一样,长大后他就是一个诚实正直的人。

这个和VLA理念里的一些行为刚好相反。比如AI思考过程的可视化、人语音指挥车的实践,这是安全优先还是炫技优先?

AI司机与人类指挥指令相矛盾或有安全风险时,听谁的? 这是纯炫技,还是对AI司机能力的不信任?

除了大量的云端AI数据,华为乾崑还在现实场景中积累了大量的人类优秀数据。截止到2025年7月底,华为乾崑辅助驾驶总里程达到40.5亿公里,泊车辅助累计使用次数2.6亿次,7月份,人均辅助驾驶里程达到699公里,是业界平均水平的2-4倍。

通过“人类司机数据+AI仿真数据”+“强化学习”的方式,华为乾崑构建了模型自学习成长闭环。

车端世界行为模型(WA):一脑多能,专题专解

云端AI司机训练只是第一步,在车端,还有更多复杂的问题需要解决。

如何统一不同信号源输入形式?如何保证模型的并发能力?如何保证低延迟?如何保证在不同的场景有专属的驾驶体验,而不是千篇一律的“机械化”动作?

这里就引出了华为乾崑WEWA架构的第二个优势:车端世界行为模型(WA)。

WA是指在车端运行的World Action Model世界行为模型。这是华为乾崑从零到一开发的原生基模型。原生架构是非常关键的一步。目前整个行业的智能驾驶方案普遍采用通用语言大模型添加交通场景数据二次训练出辅助驾驶大模型,虽然模型参数很大,但很多都做了无用功,效率很低,而且大参数模型还增加了辅助驾驶“大脑”的硬件负荷。

还有一个更致命的问题,语言大模型擅长的语言推理能力,并不适用辅助驾驶需要的空间推理能力,这样就造成了资源错配。

目前被行业热炒的VLA架构就是典型案例。VLA来源于机器人领域公开的理论范式,被引入到了智能驾驶领域。智能驾驶车辆的输入主要是视频、激光点云或者是雷达点云,输出Action,但VLA在中间加了一个大语言模型,转换成动作Action来直接控车。大语言模型在业界非常成熟,开源架构很多。它的优点是文字推理能力比较强,对交通标识等场景的理解能力强。但空间的感知与推理能力不行。辅助驾驶的车需要做具体动作,在空间里面运动,对空间的准确感知与推理是辅助驾驶的重要前提。

华为乾崑的世界行为模型WA 是从0开始训练的辅助驾驶专用大模型,空间推理能力强,距离位置判断更精准,模型精干,参数规模并不大,降低了对车端硬件的依赖,效率高,响应快。更恐怖的是,华为乾崑WEWA的专用大模型采用MoE多专家架构,在面向不同场景时,只有部分专家会被激活,这进一步提升了模型的运行效率与响应速度。而响应快几十毫秒,安全与体验将是另外一个层次。

这里我们可以参考一个实际驾驶案例,比如在双向8车道的大型十字路口,社会车辆,两轮车,自行车,包括行人,多交通参与者混行的时候,对模型的能力上限要求直线飙升,老司机处理这样的场景都会非常谨慎。这时候MoE专家模型的其中一支就会发挥作用,对这些场景专门分析,专门输出行为规划,包括一些潮汐车道,环岛车道等复杂场景都是如此,相当于每一个特殊场景都拥有一个专属的VIP专家,专题转解,效率更高,效果更好。

量变到质变:WEWA架构下,L3商用只是“开胃菜”

有人说智能驾驶是一场马拉松长跑,但我更愿意相信智能驾驶是一个结合了长短跑特征的产业。既要看选手的马拉松耐力血条,又要求选手具备快速决策调整能力。

从2013年全球发力智能驾驶开始,一直到2021年,智能驾驶呈现出来的是马拉松特征,大家在里面找方法,找出路,积累经验;熬过这一段马拉松时期,从2021年Transformer开始,智能驾驶进入短跑阶段,BEV,占用网络,端到端……技术一年一升级,每一步都不能错,错一步就就会出局。

对于所有参赛选手,既要有持续的资金积累又要有敏锐的技术判断,才能在技术收敛阶段勇立潮头。技术发展到今天,只有华为乾崑智驾ADS 4抢跑“AI训练AI”阶段,其实也揭示了市场的残酷性。这是华为乾崑在智能驾驶上持续技术迭代与进化的结果。

2021年4月,华为乾崑发布ADS 1,基于Transformer的BEV架构,率先商用城区NCA。

在技术层面,ADS 1首次创新性地采用 BEV(鸟瞰图)+Transformer 算法,成功实现3D场景感知,这为华为乾崑智驾从无到有的突破奠定了基础。

2023年4月,ADS 2如约而至,华为乾崑向业界首发了“全向主动安全”,并实现全国都能开。ADS 2最大的优势就是摆脱了对高精地图的依赖,构建了一套“全国都能开”的实用化辅助驾驶方案。并且引入 GOD 网络(通用障碍物检测),打破传统 “白名单识别”的局限性,能够精准识别锥桶、外卖小哥等异形障碍物,同时BEV与GOD协同工作,实现对“物+路”的双重感知。

2024年4月,华为乾崑ADS 3发布,业界首发“车位到车位P2P”,实现全场景贯通。

这一阶段,华为乾崑彻底摒弃BEV,采用端到端大模型,其中感知部分使用GOD(通用障碍物识别)大感知网络,而决策规划部分通过PDP(预测-决策-规划)网络来实现,同时添加本能安全网络提升表现。GOD和PDP都是端到端神经网络,在端到端架构下,ADS 3的复杂路况通行跟车更平顺、换道更柔和、通行更舒适,具体表现上,ADS 3的重刹率减少15%、平顺性提高50%、颠簸幅度减少50%。

一直到今天的ADS 4,华为乾崑WEWA架构正式将整个行业带向新高度。

仔细研究会发现,在技术迭代上,华为乾崑一直具备严密的逻辑递进规律。华为乾崑强调高价值元器件才能带来高感知性能,高感知性能才能让模型更好地理解世界,带来更合理、安全的规划决策。

它始终强调多种传感器的深度融合能力,比如激光雷达用来探测小目标、分布式毫米波雷达识别雨雾尘天气障碍物、高精度固态激光雷达识别近距离障碍物等,提升在高速L3场景中的环境感知能力。没有这个1,后面再好的模型算法都是零。

然后再将算法与整车工程的深度整合能力,比如算法与底盘的融合,在高速行驶中出现爆胎、湿滑路面等情况下仍可以保障安全;再比如算法与AR-HUD、座舱及车灯的融合,提升驾驶员的安全心理感知与车外其他车辆的安全感知能力。

在此基础上,WEWA架构才能发挥作用。在云端对天气、路况、异常情况的仿真,高可控、高密度的生成大量的高速L3难例场景训练算法,让智能驾驶真正从“学习人”到“超越人”。

技术路线快速发展,但企业要有自己的技术价值观和信仰坚持,才能行稳致远,而不是人云亦云,什么时髦讲什么。而且中途频繁切换技术路线,模型重新训练优化,工作量巨大,难以形成持续积累,用户体验也无法稳定与持续提升。

相较于行业里摇摆多变,盲目跟风的技术风格,华为乾崑对技术路线的坚持和投入,才迎来量变到质变的突破。从WEWA架构上车开始,L3只是华为乾崑ADS 4的开胃菜,智能驾驶将从类人学习正式进化到AI自主学习阶段,不断向L4、L5突破,智能驾驶技术路线正翻开新的篇章。

来源:圆周智行

相关推荐