蔚来世界模型折射出智驾发展的难点

B站影视 电影资讯 2025-05-30 20:03 2

摘要:“开蔚来的车,是没有机会在使用辅助驾驶时睡觉的。”在5月27日发出这条争议不断的推送之后。5月30日,蔚来宣布蔚来世界模型NWM正式全量推送Banyan车型。“不能睡觉”“安全升级”的世界模型首个版本,露出庐山真面目。

出品|搜狐汽车·汽车咖啡馆

“开蔚来的车,是没有机会在使用辅助驾驶时睡觉的。”在5月27日发出这条争议不断的推送之后。5月30日,蔚来宣布蔚来世界模型NWM正式全量推送Banyan车型。“不能睡觉”“安全升级”的世界模型首个版本,露出庐山真面目。

在推送之前,搜狐汽车在北京参加了一场蔚来智能辅助驾驶沟通会,提前体验到了世界模型首个版本。

从表层信息上来看,点到点全域领航辅助(即实现车位到车位功能)、智能泊车……功能数量和表现上,通过世界模型,蔚来行泊能力跟上了主流车企的脚步。

“我们之前可能慢了一点,因为在做路线的切换。当路线选定后,推动起来就比较迅速了。”针对外界对蔚来智驾“速度慢”“效率低”的评价,一名蔚来内部人士说。

同时,作为“追赶者”的蔚来,也在辅助驾驶领域的“论战”和“安全风波”中,用世界模型首个版本呈现了对辅助驾驶安全的理性思考。

沟通会及试驾过程中,蔚来汽车内部人士多次强调,蔚来不突出“0接管”及“接管率”这一概念,而是鼓励用户该接管时就接管,希望给到“安全”概念更高的权重。也正是基于安全理念,蔚来世界模型首个版本将三项“行业首发”的主动安全功能放在了“C位”。

搜狐汽车在体验蔚来世界模型的过程中,也观察到了整个辅助驾驶行业当下三点特点。

其一,行业平均水平正在提升,同时技术路线收敛,个体难以做出差异化;其二,智驾关注点从聚焦行车能力,逐渐变为同时关注主动安全能力,细分安全功能有待提升;其三,人机交互边界感仍然模糊,人、车磨合过程中,系统能力边界的不清晰,带来焦虑和危险

这三点特点,或将成为未来车企辅助驾驶发展的关键突破之处。

01 蔚来补上短板

在世界模型首个版本落地之前,智驾能力一直是蔚来作为一家高端品牌被诟病最多的地方。

智驾行业经历了多轮技术路线、功能量产上车的竞赛。最近的一次是“端到端”路线竞赛,与“车位到车位”功能竞赛。作为高端品牌的蔚来,在世界模型首个版本之前,采用的一直是传统规则逻辑技术路线,而非“端到端”,也未落地“车位到车位”功能。

但是,智驾这一短板将在世界模型首个版本落地后被补上。

世界模型是VLA之后受到行业追捧的技术概念。其能理解物理规律,并重建世界,比较普遍的定义是,能够整合多种语义信息(如视觉、听觉、语言等),通过机器学习、深度学习和其他数学模型来理解和预测现实世界中的现象、行为和因果关系。

其在辅助驾驶技术研发中的作用主要有两个,一是在云端,生成仿真数据,训练大模型;二是在车端,预测行车轨迹并做出决策。在行车场景中,其能通过想象重建多个“平行世界”,规划多个轨迹,并在其中选择最优的一个。

比如,蔚来世界模型可以在0.1秒内推演出216种可能发生的轨迹,寻找最佳决策。然后在接下来的 0.1秒内,根据外界的信息的输入,再去预测 216 种可能性。以此循环,跟随驾驶轨迹持续预测,得到驾驶的最优解。

“我们当前车端的芯片的算力还是比较充沛的,所以我们可以部署在车端。”蔚来内部人士对搜狐汽车表示。

目前,在云端布局世界模型的企业包括蔚来、理想、小鹏、Momenta、商汤绝影、华为等,在车端布局世界模型的企业仅有蔚来实现了落地,华为的车端世界行为模型则伴随着ADS4.0即将实现落地,地平线、卓驭科技尚未落地。

基于世界模型,在行车、泊车功能上,蔚来与主流车企基本实现对齐。行车方面,世界模型首个版本补上了“车位到车位”的产品形态。泊车方面,可以实现360°全向车位识别,对复杂场景车位均可以识别,并可借用通道实现长距离的漫游泊车。

搜狐汽车体验发现,世界模型首个版本整体行驶风格较为“拟人”,同时在会车、避让行人、应对汽车加塞等场景下均应对得较为丝滑、熟练。由于世界模型的技术路线特点,该系统的在行驶过程中会进行推理、思考,表现为反应灵活,但偶有犹疑。

在整个辅助驾驶功能的设定上,蔚来则展现了其一直以来理性、“稳”字当头的思考。

首先是主动安全能力的强化,蔚来世界模型首个版本推出了三大主动安全功能。

第一,行业首个量产自主靠边停车。这指的是,当驾驶员在高快道路上因各种原因失能,长时间没有响应系统的接管请求,在符合安全条件的情况下,车辆会向最右侧车道(包括应急车道)自主变道并制动至停止。

第二,首个端到端通用障碍物预警及辅助GOA。这一功能能够对三角牌、水马、锥桶等目标的防碰撞紧急制动,端到端GOA在高度上面对抬杆、道路护墙、边缘隔离栅栏、路沿等均可响应。相对可识别人、车的AEB,障碍物的识别范围大大扩张。

第三,首个大模型加持的后向被追尾预防辅助RCM。在0-150km/h的速度范围内,当车辆感知系统与大模型判断有被后车追尾的风险时,通过车内预警提醒及车外双闪尾灯预警,并可在被追尾前500ms提前给制动系统建压,防止车辆因被追尾向前移动引发二次事故

出于触发条件考虑,这三项安全功能并没有在体验环节展示。不过,在蔚来世界模型的诸多功能中,它们被放到了核心介绍位置。

“去年大家会更多地去卷‘行车’的‘0接管’。事实上,经过这一年后,大家会发现安全特别重要。”一名蔚来汽车内部人士表示,聊到辅助驾驶,大家可能更多会聚焦在城区行车能力,但蔚来的角度来说,辅助驾驶是涵盖了安全、高速、城区、泊车四个维度。

除了主动安全,稳健的理念也在行车功能设置中得以体现。蔚来首发了高速领航辅助智能驾享。该模式下,高速领航辅助的跟车更平稳、变道更稳健、防御性驾驶能力更强。

值得一提的是,蔚来内部人士告诉搜狐汽车,蔚来辅助驾驶系统不会出现提醒用户接管后就临时退出的情况,如果其提醒用户接管而用户没有接管,车辆仍然会在系统下保持行驶而非直接退出。“我们认为,这种情况下,系统退出才是最危险的。”此次上车的自主靠边停车功能,也为此类情况提供了更好的保障。

02 从技术突破到功能安全

在对蔚来世界模型首个版本的体验中,能观察到的最明显的行业特点是,各家企业之间,核心的行车、泊车功能数量,以及“车位到车位”“智能泊车”等内容没有太大的功能性区别。

辅助驾驶系统的能力主要由两个方面推动,一是算力、算法及车端硬件等综合形成的技术实力;二是环境,让技术能够不断优化的迭代数据,以及有优秀人才、AI技术发展条件的社会环境。

以人类智力发展为例。1983年,美国哲学家詹姆斯·弗林提出,20世纪以来,全球多国智商测试分数呈现每10年增长约3分的趋势。驱动因素主要有两点:生物学因素(营养改善、医疗进步等,促进大脑发育)、社会学因素(教育普及与质量提升、社会复杂度增加等)。

类比到辅助驾驶上,生物学因素与算力、算法及车端硬件有关,社会学因素则与数据仿真、数据驱动、社会环境影响相关。目前,行业在算力、算法、车端硬件上的进步较大,这带来了一轮技术革新。不过,“社会学因素”需要长期积累,不能一蹴而就,这也是功能趋于同质化的重要原因。

搜狐汽车盘点发现,在架构上,行业技术路线逐渐收敛到“端到端”。在大模型的选择,以及云端、车端是否引入世界模型上,各家略有差异。

其中,多家企业均已引入世界模型,不过多数在云端部署而未在车端部署。

同时,快速推进智驾的理想、希望建立“断代”领先的小鹏、业内智驾企业新秀元戎启行,均采用了在车端布局VLA(视觉语言动作模型)的方式。

“对于VLA技术,我相信明年它很可能会成为行业共识,虽然现在还不是。”元戎启行CEO周光在2025年4月说。5月,理想汽车创始人李想也表示,AI要能够独立完成专业工作,理想汽车当前的VLA战略,正是对这一目标的路径设计。

其实,VLA和车端世界模型,都具备理解世界、推理判断的能力。但不一样的是,世界模型在车端会进行多种可能性的推演,VLA则直接根据自己的推理做出判断和行动。

上述蔚来内部人士对搜狐汽车表示,步入端到端之后,大家的底层思考源头是一致的,只是技术路径有所不同。

基于类似的技术思考,在车位到车位功能逐渐“普及”的同时,企业对功能差异化的布局,可能将逐渐转移到安全上。

蔚来基于世界模型的首个辅助驾驶系统版本,是在工信部、中国汽车工程学会、中国汽车工业协会对智驾乱象“踩刹车”之后,首个新势力车企发布的“脱胎换骨”式的辅助驾驶系统。这一版本对安全的重视,也是当下社会对辅助驾驶需求的缩影。

2025年被称作“全民智驾元年”,第一季度,长安、比亚迪、吉利、奇瑞等多个车企宣布发力智驾普及。但在3月底,一场三人死亡的小米SU7严重交通事故发声,事件冲上热搜。后续,工信部召开会议、协会发声、企业连夜将“智能驾驶”改为“辅助驾驶”……

在更细微之处,小米SU7事件中AEB自动紧急制动未启动,小米汽车官方表示AEB功能不响应锥桶、水马、石头、动物等障碍物。这让主动安全功能的优劣,在舆论场上持续经受社会大众的拷问。

相比于主动安全,行车、泊车功能带来的震撼,安全功能很难被感知。但未来在政策、行业发展趋势、用户需求的三方推动下,更多、更好的主动安全功能的普及或将被提上日程。

03 “老命题”的新问题

在技术、功能之外,辅助驾驶系统更深的安全焦虑,藏在人机交互中。

L2级的智能驾驶仍然是人机共驾时代,辅助驾驶系统与人类驾驶员协作共同驾驶。在此过程中,信息差会影响双方判断和决策。

这类似于人与人之间的协作,沟通、执行效率会因为信息差而产生变化。乔哈里视窗将信息差划分为四类。其中,“你知道,我也知道”是最透明的区域,双方信任度高,易于高效决策;“你不知道,我也不知道”风险最高,最考验双方的经验储备;“你不知道,我知道”的情况下,主体可以掌控信息差和沟通效率。

最容易引发主体焦虑情绪的情况是“你知道,我不知道”。类比辅助驾驶,在这一区域内,车辆知道自己获取的信息和即将做出的行动,但人类驾驶员无法取得准确信息,这带来焦虑的同时,驾驶员在此情况下如采取接管决策,也很难是最佳决策。

在纯电车型的续航上,人机交互带来的“盲点”问题就已经显现。汽车续航打折引发的焦虑,多数情况下正是因为驾驶者不清楚车辆的续航能力边界。

搜狐汽车发现,不少网约车司机能如数家珍地描述冬季车辆续航打几折、开空调的影响有多大,并以此估算车辆何时需要充电。不过,充电次数更少的新车主,往往对车辆续航把握度不高,也就更容易陷入续航焦虑之中。

在辅助驾驶中,这一问题再次显现,并且可能更加危险。在行车过程中,人类驾驶员如果不清楚车辆的推理、决策逻辑,在紧急情况下可能会产生焦虑情绪,或是采取急刹等策略,导致危险发生。

体验蔚来世界模型首个版本的过程中,搜狐汽车遇到了三个较为“惊险”的情况。

第一个情况是车辆在即将驶出匝道口的时候,向主路方向加速并入,个人从视觉上推理认为车辆可能有与匝道护栏刮擦的风险,遂选择刹停。第二个情况是车辆在城区道路行驶,探测出有行人后车辆减速但未刹停,遂选择刹停;第三个情况是车辆在进入停车场时,车速较快且停车场入口前方有障碍车辆,有碰撞风险,遂选择刹停。

蔚来汽车内部人士表示,第二个情况下车辆一定会选择刹停,可以信任。至于第一、第三个情况,搜狐汽车复盘发现,在车辆的计算中,这可能都能实现类似“擦肩而过”的效果。但由于车辆并未将自身策略、判断信息告知驾驶人,驾驶人不清楚车辆的能力边界,最终导致两次急刹。

一个比较好的案例是蔚来世界模型实现的自由交互寻路。搜狐汽车在体验这一功能中发现,在车辆自主寻找停车场出口的过程中,其会在屏幕上对识别到的文字进行高亮,并以文字的方式呈现车辆寻找出口的思考逻辑,以及下一步的行驶动作,这极大地增强了驾驶者的安全感和信任度。

但目前,这一功能只在停车场场景开放。同时,行车过程中系统的决策更加复杂,“盲区”问题要得到解决,挑战较大。但在以“安全”为主旋律的技术发展之中,人机交互无疑是一个无法忽视的命题。

来源:世界文化谷

相关推荐