摘要:4 月 8 日,在 2025 首尔国际车展(Seoul Mobility Show 2025)期间,拥有第一代 AI 专业博士背景的周光,受邀在首尔国际车展论坛(Seoul Mobility Show Forum)发表了题为《端到端大模型,驱动智能驾驶全球化快
文/朴晋泽
编辑/cc孙聪颖
4 月 8 日,在 2025 首尔国际车展(Seoul Mobility Show 2025)期间,拥有第一代 AI 专业博士背景的周光,受邀在首尔国际车展论坛(Seoul Mobility Show Forum)发表了题为《端到端大模型,驱动智能驾驶全球化快速部署》的主题演讲,深入剖析了 VLA 模型的技术进展。
周光身后是其在2019年创立的元戎启行(DeepRoute.ai)。演讲中,周光还分享了元戎启行在规模化量产落地方面的实践经验,并对行业未来趋势作出展望。
此次亮相首尔车展,是元戎启行正式进军韩国市场的关键之举。周光在演讲中提及的视觉语言动作模型(Vision - Language - Action 模型,简称 VLA 模型),融合纯视觉与激光雷达方案,可适配多种计算平台,灵活性极高,能够全方位满足全球汽车制造商的多样化需求,极大地加速智能驾驶技术的规模化落地进程。
作为行业前沿模型,VLA 模型今年将在超过五款车型上实现落地应用,助力全球汽车制造商快速迈入 AI 驱动的智能出行新时代。
中国首款搭载元戎启行 VLA 模型的智能驾驶汽车,预计于 2025 年年中正式投放消费市场。基于 VLA 模型的端到端推理能力可达几十秒,长时序推理能力越强,对实时复杂路况的应对处理能力就越出色,且能通过思维链逐步展现系统的决策过程,涵盖周围环境感知、预测结果以及行驶规划等环节。凭借更卓越的驾驶性能和高度透明的智能决策机制,该模型能够切实增强用户对智能驾驶技术的信任度。
周光介绍道:“我们正面向韩国当地客户展示端到端 2.0 版本,也就是视觉语言动作(VLA)模型。自今年年初起,中国的智能驾驶行业便开启了对端到端模型的探索。鉴于视觉语言动作(VLA)模型与端到端 1.0 版本存在显著差异,我们期望将这项最新技术引入韩国市场。此技术超越了以往的专用智能系统,具备更高的安全性。目前,我们所采用的架构与特斯拉的完全自动驾驶(FSD)V13 版本极为相近。”
阿里领投,与中国企业广泛合作
对于韩国车企而言,元戎启行还是个陌生名字。但在中国市场,其核心技术已与长城、Smart 等多家主流车企达成量产合作。
其中,与中国头部智能车企品牌长城汽车合作的新款车型,于 2024 年 8 月正式下线。在 2024 年第四季度,元戎启行凭借单款车型斩获超 15% 的市场份额。随着智能驾驶成为日常出行刚需,行业即将迎来爆发式增长,技术护城河正成为企业抢占市场的关键。
图:元戎启行(DeepRoute.ai)CEO 周光发表演讲。
2021 年,元戎启行获得阿里巴巴 3 亿美元战略投资,阿里成为其最大股东。阿里看重其纯 AI 技术路线,认为其原生 AI 思维更具商业化潜力。这笔融资让元戎启行估值突破 10 亿美元,跻身独角兽行列。
对于阿里为何阔绰出手领投元戎启行,周光有自己的见解。他认为,大多数自动驾驶公司成立于 2016 年到 2019 年期间,那时多数人对人工智能认识模糊,大多公司采用编程、基于即时定位与地图构建(SLAM)技术、编写代码等方式。“我觉得我们最大优势在于公司完全基于人工智能。像阿里巴巴这样的互联网巨头,认为我们的人工智能基因和原生 AI 思维模式,更易取得成功。”
图:智能驾驶系统的发展
在周光眼中,元戎启行优势显著。周光指出:“我们拥有顶尖的人工智能技术。我们是中国研发视觉语言动作(VLA)模型的领先企业,也是率先开发早期融合技术的公司。我认为视觉语言动作(VLA)模型将是自动驾驶的下一个发展方向。”
海外扩张为何首站选韩国?
韩国为何成为元戎启行出海首站?实际上,韩国国土面积虽小,在汽车领域却是当之无愧的 “大国”。作为世界第五大汽车生产国,韩国在全球影响力巨大。近年来,现代、起亚等整车企业在智能驾驶与电动化转型方面投入巨大,韩国车企加快自动驾驶技术研发与实际部署,L2 级辅助驾驶已逐渐成为新车型标配,部分车企还积极推进更高阶自动驾驶能力。随着全球智能出行趋势加速,韩国本土市场对 AI 驱动的智能驾驶解决方案高度关注,车企期望借助全球前沿技术加速智能化升级,这为元戎启行等技术供应商创造了良好合作契机。
图:VLA智能驾驶系统的思维链展示
由此可见,韩国在电动化及智能驾驶领域的迅猛发展使其成为国际焦点,这也是元戎启行全球战略的核心市场之一。
周光也认为:“韩国汽车制造商一直走在智能驾驶创新前列,并将最新技术应用于量产车型。元戎启行在中国市场积累了丰富的智能驾驶量产经验,我们期待与韩国车企深度合作,共同推动 AI 驱动的智能出行发展。”
对于目前元戎启行与车企开展的合作,周光表示:“具体合作车企暂不方便透露,但我们确实有海外运营计划。我们已在德国进行智能驾驶路测。日韩、欧洲是我们重点关注的市场。商业进展目前不便透露,韩国是今年海外拓展的第一站。借此次参展机会,我们将与韩国车企深入交流沟通,未来也不排除开展本地路测。”
智驾行业内卷,勇敢者先出海
近年来,智能驾驶行业竞争愈发白热化,头部企业在算法研发、场景落地与商业模式探索等方面不断加大投入。特别是在自动驾驶这一技术门槛高、投入大、回报周期长的领域,行业 “内卷” 现象愈演愈烈。国内企业不仅在有限的测试资源和政策红利激烈竞争,还在加速探寻商业化落地的突破口。
图:元戎启行在首尔国际车展的展台
在此背景下,元戎启行较早开启 “出海” 战略布局。作为中国智能驾驶企业中的先锋,元戎启行已在德国和新加坡展开业务部署,并且率先在德国成功开展测试工作 。与专注国内市场的企业相比,其海外布局不仅有助于规避单一政策或市场波动带来的不确定性,还为获取多元应用场景与客户资源、塑造国际化品牌形象提供了战略支撑。
在当下的智能驾驶竞争格局中,元戎启行面临着诸多强劲对手,其中包括致力于研发智能驾驶系统的华为 ADS、特斯拉 FSD 等业内知名企业 。这些企业在技术路线和商业化模式上各有优势,但共同面临行业性难题,即盈利模式尚不清晰。
所以,元戎启行的 “出海” 并非只是业务拓展尝试,更是一种理性的风险对冲策略。尽管海外市场同样充满变数,但作为先行者,有助于其积累应对多元场景与跨国法规体系的经验,为未来技术与商业模式在全球复制奠定基础。
图:元戎启行与高通技术公司签订合作协议
在自动驾驶技术演进方面,多数企业仍在端到端 1.0 阶段探索,而元戎启行已实现 VLA 架构的实际应用,具备一定先发优势。尤其在无高精地图路线探索上,其方案通用性更强,为解决传统路径在海外适配难题提供了可能。通过提前布局海外市场,企业不仅获得更多维度的实测数据,也进一步提升了抵御国内市场风险的能力。
然而,元戎启行能否在这场全球化竞争中持续领先,仍取决于其在产品可靠性、商业落地能力及跨国适配能力上的长期考验 。之后《华尔街科技眼》对周光进行了专访。以下是专访实录。
专访部分:
1.华尔街科技眼:目前智能驾驶系统有基于激光雷达,也有基于摄像头的,元戎启行(DeepRoute.ai)的系统是如何运行的呢?
周光:在我看来,基于激光雷达还是基于摄像头来构建系统,并非关键要点。人工智能系统的重中之重,在于其人工智能架构。激光雷达和摄像头本身并未发生本质改变,它们仅仅是在感知层面,为系统提供了额外的数据采集渠道。在面对未知物体时,增加激光雷达或许能够提升感知性能。但在大量其他场景下,激光雷达所能发挥的作用相当有限。尤其是在类似视觉语言动作(VLA)这样关乎行为决策的层面,激光雷达的作用更是微乎其微 。
2.华尔街科技眼:如果一家外国汽车制造商打算挑选自动驾驶技术,你觉得元戎启行能吸引他们的最突出优势是什么?
周光:我们的技术性能处于领先地位。举例来说,当前多数竞争对手仍在全力研发端到端 1.0 版本技术,而我们的端到端 1.0 系统早已成功部署并应用于量产汽车。由此可见,相较于其他竞争对手,我们的技术领先优势在一年左右。这一领先优势使得产品性能表现截然不同。搭载我们系统的汽车,其驾驶体验如同人类驾驶一般自然流畅,并且具备极高的安全性。此外,我们的系统还拥有推理能力,能够让消费者在选购汽车时更添信心。
3.华尔街科技眼:你们的系统兼容性如何?你们能将其应用到其他平台上吗?
周光:能的,我们支持的平台不止一个。我们可以支持英伟达(NVIDIA)、高通(Qualcomm)以及其他系统级芯片(SoC)平台。
4. 华尔街科技眼:海外国家和地区的交通法规差异很大。那么在进入韩国市场时,要如何进行本地化呢?
周光:首先,不同国家所使用的导航地图存在差异。以中国为例,我们常用百度地图或高德地图,而在韩国,可能就得依靠 Naver 地图或者 HERE 地图。不过,一旦完成地图适配工作,便会发现韩国的整体交通状况与中国极为相似,二者均为右舵驾驶,且都有掉头和环岛等路况,可能仅在交通信号灯设置上存在些许细微差别。因此,从整体来看,针对韩国市场的适配工作量并不大。
其次,我们运用的是端到端模型。该模型具备强大的泛化能力,属于通用型人工智能系统。
当前,我们正在德国开展道路测试。德国与中国在交通状况等方面的差异,远比韩国与中国之间的差异大得多。所以,只要完成地图适配,基本上就等同于完成了本地化工作的绝大部分。鉴于韩国路况与中国路况差距极小,我相信我们在韩国市场将会有更为出色的表现。
5.华尔街科技眼:元戎启行的其他竞争对手的竞争力强吗?跟你们相比,他们有没有明显的优势?
周光:部分公司高度依赖强大的基础设施来支撑其业务。例如,他们会增添额外的地图图层,或是针对特定道路进行过度拟合操作。然而,这种模式在海外部署时往往会遭遇阻碍。究其原因,是由于在海外构建自身基础设施极为困难,毕竟这些公司的运作高度依赖当地的地理信息,而获取并搭建相应地理信息基础设施并非易事。
与之不同的是,我们采用的解决方案完全基于人工智能技术,能够实现实时推理,不受地理信息基础设施限制,可灵活适应不同地区的复杂情况 。
6. 华尔街科技眼:有没有计划与韩国的汽车制造商或机器人公司合作,共同开发人工智能星火(AI Spark)平台或视觉语言动作(VLA)模型呢?
周光:我们十分乐意开展合作。在我看来,这个行业需要构建一个生态系统。我们在人工智能模型方面具有专长,因此会专注于自身的人工智能系统,与生态系统中的不同合作伙伴携手协作,以达成商业化目标,这是我们秉持的原则。
从自动驾驶演进至道路通用人工智能(RoadAGI),这一历程映射出技术从 “弱专家系统” 向 “通才系统” 的进阶轨迹。大语言模型的发展同样历经了三个阶段,即从弱专家系统起步,发展至通才系统,最终迈向强专家系统。
如今,我们所谈及的垂直大模型,像科学、医疗保健等领域的人工智能,均属于强专家系统。一年前,市面上还都是通才人工智能模型。我认为自动驾驶技术的发展进程相较之大语言模型滞后一年。我们期望重构这项技术,使我们的人工智能模型具备通用性,能应用于各类机器人。如此一来,我们才能拥有适用于机器人的基础模型,进而实现 L5 级自动驾驶。L5 级属于强专家系统,意这味着车辆在道路上可完全无需驾驶员操作。
我认为技术发展也有其自身的周期,而一个周期就代表着一次代际迭代。
7. 华尔街科技眼:阿里巴巴是你们最大的股东,那么在他们眼中,你们的优势是什么呢?
周光:大多数自动驾驶公司成立于 2016 年至 2019 年期间。彼时,多数人对人工智能缺乏清晰认知。那时,大多数公司采用编程、基于即时定位与地图构建(SLAM)技术以及编写代码等方式开展业务。而我认为,我们公司最大的优势在于,从创立之初就完全基于人工智能。我从 2011 年开始攻读人工智能专业博士学位,当时正值第一代人工智能时期。像阿里巴巴这样的互联网巨头,看中的正是我们公司所具备的人工智能基因,以及原生的人工智能思维模式,他们认为这让我们在行业竞争中更具成功的可能性。
过去几年间,实践不断证明,我们在无地图解决方案、端到端模型以及视觉语言动作(VLA)模型等方面所践行的技术路线是正确的。反观一些专注于即时定位与地图构建(SLAM)技术,或是单纯依赖编写代码的公司,在实际落地应用环节遭遇诸多困难。因此,我认为我们是少数几家拥有纯正人工智能背景的自动驾驶公司之一,在技术路线和发展方向上具备独特优势。
8.华尔街科技眼:阿里巴巴也提供了各种各样的人工智能模型。你们也会使用其中的一些模型吗?
周光:目前,我们并不使用他们的模型。大模型属于数字人工智能范畴,而我们从事的是物理人工智能领域的工作。新范式的物理AI确实会借鉴数字人工智能的技术,但数据闭环方式有所不同。比如说,物理人工智能对于人工智能安全性的容忍度更低。如果你向 ChatGPT 提问,它给出了一个错误答案,可能不会造成太大的危害。但如果同样的情况发生在智能驾驶汽车上,就有可能引发交通事故。整体的后果是不一样的。所以物理人工智能对安全性更为敏感。除此之外,我们确实会使用阿里云等服务。阿里巴巴在大语言模型方面也非常强大。
9.华尔街科技眼:你们的解决方案在市场上的反响如何?
周光:我认为市场对我们的解决方案深感新颖。特别是近两年来,大语言模型蓬勃发展,在此背景下,人工智能的影响力已毋庸置疑。总体而言,市场对我们的解决方案反响极佳,因为我们独辟蹊径,摒弃传统方法,转而运用人工智能技术来实现自动驾驶 。
10.华尔街科技眼:既然你无法透露与当地汽车制造商的详细合作情况,那能否向我们介绍一下你们针对韩国市场的整体规划呢?作为自动驾驶领域的专业企业,下一项关键技术会出现在哪里呢?
周光:对于韩国市场,我们确实期望能与当地汽车制造商和机器人公司展开深度合作。但现阶段,具体细节暂不方便透露。
如我之前所说,实体人工智能的发展进程相比大语言模型大约滞后一年。其发展轨迹是从弱专家系统迈向通才系统,最终进阶为强专家系统。目前,我们正处在从弱专家系统向通才系统过渡的的首个阶段。一旦在这一过渡阶段取得良好进展,元戎启行(DeepRoute.ai)便能够为所有智能体构建道路通用人工智能(RoadAGI)。后续目标是打造出具备强专家系统的 L5 级自动驾驶系统,依我看,我们有望在三到五年内达成这一目标。鉴于当下快速的发展势头,我们满怀信心,借助全新的人工智能架构实现 L5 级自动驾驶。就像特斯拉发布完全自动驾驶(FSD)V13 版本时,整体安全水平实现大幅跃升一样 。
来源:华尔街科技眼