摘要:上汽通用与Momenta携手,将全球首个量产落地的端到端强化学习大模型——R6飞轮大模型,搭载于别克至境L7。这并非一次简单的技术迭代,而是一次对智驾发展路径的重新定义。它意味着,汽车的“大脑”开始告别单纯的模仿,迈向能够自主进化、甚至超越人类经验的“老司机”
上汽通用与Momenta携手,将全球首个量产落地的端到端强化学习大模型——R6飞轮大模型,搭载于别克至境L7。这并非一次简单的技术迭代,而是一次对智驾发展路径的重新定义。它意味着,汽车的“大脑”开始告别单纯的模仿,迈向能够自主进化、甚至超越人类经验的“老司机”时代。
【汽车维基】将深入解析,Momenta R6这颗“最强大脑”如何通过30亿公里的自我博弈与强化学习,炼就应对中国复杂路况的终极能力。它如何超脱于“纯视觉”与“激光雷达”的路线之争,以更高级的算法架构,为合资车企打响了一场最硬核的“本土化”反击战。
我们即将揭开的,不仅是技术的面纱,更是智能驾驶未来的新范式。
8月18日,上汽通用宣布在其别克至境L7上全球首发搭载基于端到端的“强化学习”大模型——Momenta R6飞轮大模型。
这不是简单的技术升级,而是国内首个量产落地的端到端强化学习大模型,它代表着智能驾驶技术从单纯模仿人类到超越人类能力的重大跨越。
01
模仿 or 超越?两种技术路径的本质差异
要理解R6飞轮大模型的突破性,我们首先要了解传统智能驾驶系统的技术路径。
现有的智驾系统大多基于“模仿学习”大模型,其核心逻辑是模仿人类驾驶行为。
就像学生学习做题,模仿学习模型通过分析大量人类驾驶数据,学习如何在各种场景下操作车辆。这种方法有其局限性——系统的能力上限不会超过人类驾驶员的整体水平,且在极端场景下的应对能力有限。
而Momenta R6飞轮大模型采用了完全不同的技术路径——强化学习,这是区别于其他“模仿学习”大模型的自我学习。这种模型的运作机制类似于训练一名职业运动员:通过在模拟环境中无数次“试错-优化”循环,不断自我学习和完善。
强化学习模型不再局限于模仿人类行为,而是通过“成功就奖励,失败就惩罚”的机制,从每一次决策的结果中学习,从而突破人类驾驶数据的天花板,实现真正的自主进化能力。
02
海量数据训练,打造智能驾驶“最强大脑”
R6飞轮大模型的训练过程令人惊叹。它依托30亿公里实战里程提炼的7000万组场景数据,通过高频次闭环训练强化复杂场景应对能力。
这些数据涵盖了各种极端和复杂路况,形成了Momenta独特的“噩梦题库”。模型在这个题库里进行特训,从每一次成功避险和潜在风险中汲取经验,自主决策不断优化。
具体来看,R6模型的训练过程类似于人类积累驾驶经验的过程,但速度和规模远超人类。它每天在模拟环境中进行数百万次的“试错-优化”循环,处理各种极端情况,从而不断优化自己的决策机制。
这种训练方式使R6大模型具备了强大的泛化能力,能够从容应对各种前所未见的复杂场景,包括加塞、鬼探头、盲区遮挡等传统系统难以处理的路况。
03
“决策层”:R6飞轮大模型是端到端算法大脑
Momenta R6飞轮大模型本身是一个“传感器无关”的端到端算法大脑,它既不是纯视觉,也不是激光雷达派,而是站在更高维度的“决策层”。
但在实际装车时,车企可以根据成本和性能目标,为它搭配不同的“眼睛”(传感器),可以是纯视觉,也可以是包含激光雷达的融合系统。
如果深入浅出地解释一下就是:R6大模型的本质是一个更强大的“大脑”。
你可以把智能驾驶系统分成三个层次:眼睛(感知层):摄像头、激光雷达、毫米波雷达等传感器,负责“看”世界;神经(算法/模型层):处理“眼睛”看到的信息,理解环境并做出决策,这就是R6所在的位置;手脚(执行层):转向、刹车、油门等,执行“大脑”发出的指令。
R6飞轮大模型的核心突破在“神经”(“大脑”)部分。 它采用“端到端”架构,将感知、预测、规划等多个模块融合成一个庞大的神经网络。
这意味着:它不关心数据来源:无论是摄像头拍的图片,还是激光雷达生成的点云,对它来说都只是输入的“数据”。它学习的是这些数据与最终驾驶行为(如方向盘转角、刹车力度)之间的映射关系。
它的优势是“思维模式”,通过海量数据(30亿公里)和强化学习,它学会了更接近人类、甚至超越人类的决策能力,处理复杂场景(如加塞、鬼探头)更聪明、更流畅。
所以,R6本身是超脱于“视觉”和“雷达”之争的。它就像一个天才学生,你给他文字书、带插画的书或者有声书,他都能学得很好,他的强大在于其“学习方法和理解能力”,而不在于他用了哪种媒介学习。
那么,接下来的步骤就是,在实际装车过程中,车企如何为R6选择“眼睛”?
虽然R6大脑本身不挑食,但车企在具体量产车上,需要根据车型定位、成本和性能目标,来决定给它配备什么样的“眼睛”。
这就是为什么你会看到差异:
在上汽通用别克至境L7上,因为这款车定位高端豪华,追求极致安全和性能,所以选择了顶配的“眼睛”——包括12个超声波雷达、12个摄像头(11个车外摄像头+1个驾驶员疲劳检测摄像头)、3个毫米波雷达和1个激光雷达,共4类28个感知设备。
在这里,R6大脑享受着最丰富的视觉+雷达融合数据,能力能得到最全面的发挥。
然而,在其它可能搭载R6的车型上(尤其是性价比车型),为了控制成本,车企很可能选择不配备激光雷达,只给R6提供摄像头和毫米波雷达的数据。
在这种情况下,R6依然可以工作,并且凭借其强大的算法能力,其纯视觉方案的表现很可能优于其他家的纯视觉方案。
04
实战表现:更智能、更流畅、更安全
Momenta R6飞轮大模型在实际道路场景中的表现展现了三大特点:极智的安全、极智的丝滑和极智的高效。
在ETC通行场景中,R6大模型展现出在无车道线环境下的实时高精度建图能力。结合别克“逍遥”架构的跨域控制,实现了转向与制动的协同,延迟时间更短,从进站到出站更加流畅。
“不停车一键泊入”功能则彻底重新定义了泊车体验。车辆可在行驶中实时识别车位,系统自动规划最优泊车轨迹,省却了停车、选位、按键开启泊车的繁琐步骤,大幅提升了泊车效率。
更令人印象深刻的是,R6大模型能够应对各种复杂车位场景,包括让老司机都犯怵的机械停车库,真正做到无差别车位泊入,彻底打破“停车焦虑”。
05
安全设计:多重冗余,极致保障
智能驾驶系统的安全性是用户最关心的问题。别克至境L7搭载的智能驾驶系统在安全方面做了极致的设计。
硬件配置上,除了上面说的,至境L7采用了12个超声波雷达、12个摄像头(11个车外摄像头+1个驾驶员疲劳检测摄像头)、3个毫米波雷达和1个激光雷达,共4类28个感知设备,构成了系统感知基础。
更重要的是,车辆配备了三重冗余制动系统:电制动、液压制动和电子驻车制动,以及双ECU和双传感器的转向控制系统。这样的冗余设计在业内并不多见。
整个系统按照行业最高的ASIL-D功能安全等级设计。ASIL-D(汽车安全完整性等级D)是汽车功能安全领域的最高标准,源自国际标准ISO 26262,对应“最高风险场景”的安全保障需求。
ASIL-D不是“事后检测”的结果,而是从系统设计到报废的全生命周期强制要求,核心目标是“通过流程和技术手段,将故障风险降到可接受水平”。
06
本土化适配:更懂中国路,更懂中国人
上汽通用与Momenta的合作不是简单的“拿来主义”,而是深度耦合。
上汽通用泛亚汽车技术中心凭借28年积累的百万公里中国路谱数据和120+种道路工况,以及超过2000万用户的驾驶行为数据库,为驾驶辅助系统提供了最适合中国复杂路况的底盘控制技术支撑。
这些本土化数据与Momenta的算法深度融合,使系统能够更好地理解中国特有的交通场景和驾驶员行为习惯,提供更符合中国用户需求的智能驾驶体验。
通用汽车Super Cruise系统全球超过8.77亿公里的安全行驶经验也被深度融入此次与Momenta的合作中,推动双方在驾驶员监测、多级接管、故障处理、边缘场景应对等关键安全领域实现技术跃迁。
07
未来展望:智能驾驶的新范式
Momenta R6飞轮大模型的首发搭载,代表了智能驾驶技术发展的一个新方向。行业正在正本清源,让智驾从安全出发,回归“保护人”的本质。
与一味追求算力参数和硬件堆料不同,R6大模型通过算法创新和数据处理方式的变革,实现了智能驾驶体验的质的飞跃。
这种技术路径不仅提高了系统的性能和安全性,更重要的是,它为智能驾驶技术的普及和应用提供了新的思路——通过算法优化和数据利用效率的提升,让智能驾驶变得更加智能、可靠和实用。
随着更多车型搭载类似技术,智能驾驶将逐渐从高端配置转变为普及化的安全辅助功能,为更多用户提供安全、便捷和舒适的出行体验。
08
结语
秋天将至,当第一批别克至境L7驶下生产线,交付到用户手中时,这些搭载着R6飞轮大模型的车辆将不断学习、进化。
它们在上海陆家嘴的复杂环岛、在北京三里屯的拥堵路段、在重庆的魔幻立交上,积累着对中国道路的深度认知。
智能驾驶的未来,不再只是科幻电影中的想象,而是正在我们每天行驶的道路上悄然演进的现实。
来源:汽车维基