摘要:在过去的十年里,这句话被超过800万用户呼唤了整整200亿次。它成为了中国智能汽车发展史上的一个标志性符号,象征着语音交互的普及。尽管多屏联动、语音控制已成为行业范本,但从“能用”到“好用”之间,似乎总隔着一道无形的墙,语音唤醒既是一个时代的符号,也成为了一种
“你好,斑马。”
在过去的十年里,这句话被超过800万用户呼唤了整整200亿次。它成为了中国智能汽车发展史上的一个标志性符号,象征着语音交互的普及。尽管多屏联动、语音控制已成为行业范本,但从“能用”到“好用”之间,似乎总隔着一道无形的墙,语音唤醒既是一个时代的符号,也成为了一种局限。
行业共识已经形成:2024年,智能座舱的潜在搭载率超过73%,其价值正从单一硬件转向移动空间体验,从被动响应转向场景服务,产业逻辑也从硬件定义变为软件主导。然而,在新的十字路口,一个核心问题依然悬而未决:当我们已经把座舱的硬件之“形”做得足够好,那作为灵魂的“AI”,其智商与情商究竟该如何注入?
2025年云栖大会上,斑马智行给出了它的答案。其首席产品官蔡明隆重发布了行业首个全模态端侧大模型解决方案——AutoOmni。这不仅仅是一款新产品,更代表着一种对智能座舱未来走向的深刻判断:是时候告别“你好,斑马”的时代了。
破局之道:全模态+端侧表面的繁荣之下,智能座舱行业一直存在一种普遍的焦虑。“今天在这个市面上卖的很多车,其实配置非常好,非常高,甚至都是超配的。但是软件体验差强人意,”蔡明在演讲中一针见血地指出了行业怪象,“有算力,但没有场景;有屏幕,大屏很好,没内容;有一些智能设备其实也没有被真正用上。”
其根源在于,智能车的价值释放逻辑与传统车已截然不同。传统车上,硬件配置的价值转化简单直接——发动机排量从1.5到2.0,用户立刻能感受到“车更有劲儿了”;轴距加大,“腿能伸开了”;真皮座椅则“很有档次”。这些体验易于感知,也便于市场宣传,最终能形成差异化的价格。
但到了智能车时代,硬件配置变成了算力平台、芯片、内存带宽和传感器。“每一个都没有办法单独的去来形成任何的用户体验的闭环,他们交织在一起,成为一个复杂的智能化系统。这就让这些硬件配置的价值释放变得非常的困难。”蔡明总结道。车企们陷入了“参数内卷”,疯狂堆砌硬件,却无法让用户真切地感受到这些配置带来的体验升级。
AutoOmni的命名本身就蕴含着它的技术野心。蔡明在发布会上解读道:“Auto当然是指专属于车行业;Omni(全模态)是指相较于大语言模型,可以感知获取语言以外的广泛全面的输入信息,包括声音、图片和影像能力,这感知能力超强。”
这一切的核心目的,是为了让AI真正获得“人”一样的感知能力。
蔡明将人工智能的核心能力稳定地归纳为三个维度:感知、思考和记忆。他认为,当前主流智舱方案更多依赖云端大模型,解决了“思考”能力,但严重缺乏“感知”(无法直接处理车内视觉等信号)和“记忆”(无法实现全时空记录)。端侧全模态方案正是为了补上这两个关键维度,使AI三要素趋于均衡发展。
全模态能力到底有多重要?蔡明在会后的访谈中,阐述了一个更为根本的观点:缺乏全模态功能的端侧模型,即使放在车端其实没有太大用处。
“大家都认为自然语言交流是趋势,但是其实自然语言交流不仅仅是语言。语言本质是对人说的,而人的感知能力不只是接受语言。人和人交流的时候,语言本身只占到一个很小的比例。心理学家艾伯特·麦拉宾(Albert Mehrabian)在20世纪70年代的研究中表明:人们对一个人的印象,约7% 来自谈话的语言和内容,38% 来自说话的语调、语速和声音,55% 来自外型、表情、姿势等肢体语言。”
这意味着一个人跟AI交流,如果不是经过特别的训练,AI大概率是无法100%听懂的,因为AI缺乏能力去了解这个段对话发生的场景。
“假如我说‘我很饿了,找一个孩子爱吃的餐厅,然后把座椅调舒适’。这句话背后有无数语言无法传递的信息:车上有几个孩子?以哪个孩子的口味为主?孩子的口味是什么?调座椅是调谁的?是车主本人,还是另一位没有发出指令的家人?”蔡明补充到“很多时候事实的真相离这种片段的信息非常远,这个东西怎么能补全?只有全模态能力的端侧模型辅助下的自然语言交互,才是完整的自然语言交互。”
正是基于对行业痛点的深刻洞察,斑马智行选择了将“全模态”与“端侧”作为其技术破局的核心支点。蔡明在访谈中指出,当前正是一个质变节点,因为云端多模态大模型的能力已被验证且发展迅速,当前任务是如何将其能力在端侧以更小的参数规模保持在下限之上。
而AutoOmni“全模态+端侧”的解决方案也同时给国际主流和国产车载芯片的产业发展开辟了新的视野。因为它完成了一个底层的范式转换,从“芯片能力定义功能上限”转变为“用户体验需求定义芯片规格”。“全模态”和“端侧”的落地要求,将技术竞争从单纯的算力指标,转向对低功耗持续计算、多模态数据处理等特定场景能力的深度优化,为全球的车载芯片产业指明了一条新的发展路径。
专注提升能力,让功能和场景涌现AutoOmni究竟能为智能座舱带来哪些新的体验?蔡明在演讲中系统地阐述了其带来的三大能力跃迁。
首先,是全模态的感知(长聆听和长睁眼),让智舱“能听会看”。其次,是这种感知叠加了端模型Always-On的特性,就可以做到全时空的记录,让智舱拥有“记忆”。最后,是思考与感知让AI聪明,感知与记忆又让AI敏锐,思考和记忆让AI有学习成长的能力,最终实现类人的AI助理。
为了具象化这些能力如何转化为用户体验,蔡明用一个坐标轴分析了用户场景:横轴是意图和需求,纵轴是意图的执行和需求的满足,由此得到四个象限——需求明确且及时满足的及时性场景、条件性场景(if…then…)、规划迭代性场景(有持续时间的复杂任务)以及闲聊型场景。再根据其发起方分为用户发起和AI发起,构成了八个场景板块。
基于此,AutoOmni的作用主要体现在三个方面:
其一,是对存量场景的增强。同样是调空调,因为AI“有了眼睛”,知道后排有女儿在睡觉,因此只会操作前排。同样是听音乐,因为看到了副驾驶坐着女朋友,就可以播放两个人都喜欢的音乐。同样是聊天,也因为知道座舱里的角色和环境,可以把所有人以及外面正在下雨下雪的因素都纳入聊天内容中。
其二,是打开了规划迭代型场景。蔡明以策划一场多人出游为例,反驳了“AI制定行程规划早已实现”的观点。他认为,一个一两个月后发生的重要事情,不可能通过几分钟的几轮对话完成,它必然是一个长周期的、不断优化调整的过程。AI真正的工作流程是:先提供初步规划,然后在任务完成前,多次精准找到用户的空闲时间主动发起互动,每一次都提供有价值的帮助和资讯,同时获得用户不断更新的外界条件变化,不断优化迭代。“智能车相较于其他的智能设备,在处理这一类的事情上,是有先天的不可替代的时空优势,”蔡明强调,“因为人常在车里,又经常有空闲的时间,且人和AI又有相对独立的相处的一个时空。”
其三,是实现AI发起的场景。这是主动智能的真正体现。例如,车开着开着进入雾区,就应该直接打开雾灯并告诉用户,同时咨询是否有其他服务需求;老人一上车应该自动调整座位;看到女儿入睡,应该自动调整空调风量和方向,播放助眠音乐;发现用户每个工作日九点都会开车到园区门口摇下车窗,AI就可以自动设定一个周期性的任务(如提前调出支付界面),并在刮风下雨时自动暂停那一天的执行;在假期前主动询问出游计划,或在感知到用户疲惫、烦躁时,主动提供数字娱乐或本地生活服务。
当别的智舱解决方案还在讨论功能时,蔡明的思路却完全不同。“我不太想讨论具体功能和场景,之前很多的功能都是由产品经理定义出来的,而我认为很多功能和场景没有出现的本质原因是模型的能力还不够,没法形成服务闭环。我们更多做的是‘能力’,能力提升了,功能和场景自行生长和涌现。大家总是在问功能,但AI时代我们更应关注的是能力。”
背后的硬仗:工程化落地与生态共建将强大的模型顺畅地在部署在端侧芯片上,是一场艰难的工程硬仗。蔡明在演讲中特别感谢了高通的工程团队,“几个月来,我们共同投入了五十多名系统级算法专家,通过了15000小时的研发,15个版本的迭代,解决了芯片适配一千多个技术问题。然后将这个推理效率提升了三倍多。”他透露,为了给客户提供最好的产品效果,团队至今仍在持续优化中。这也凸显了斑马智行十年深耕汽车行业所积累的优秀工程化能力、久经考验的稳定性以及快速上车的保障力。
除了工程能力,战略合作同样是关键基石。蔡明宣布了两个“独家绑定”:斑马的AutoOmni基于阿里通义千问大模型深度定制且独家绑定;在行业内率先完成高通8797的适配,也是与高通的独家绑定。“我觉得这里应该有个掌声,”他自信地说道。这种深度的绑定关系,构成了斑马在初期显著的技术壁垒和领先优势。
然而,斑马的野心并止于技术供应商。蔡明清晰地阐述了斑马的三层定位:第一是做好开放的操作系统;第二是成为领先的AI全栈技术服务商;第三,则是成为最好的车载平台服务提供商及联合运营商。 这第三层定位,指向了一个更宏大的生态梦想。
他从商业逻辑上分析,认为大模型投入巨大,任何车厂都没有道理独自承担,“这不符合基本的商业逻辑”。今天的新势力巨头,如理想,也绝不会把自己的座舱系统开放给任何竞争对手。因此,他认为行业必然会出现专业供应商,就像传统汽车行业的发动机供应商一样,而斑马立志成为“智能座舱AI的整体解决方案”提供者。而此次斑马也为车厂提供了交钥匙和AIbox两种部署方式,既可以满足一部分对智能座舱非常乐观积极的车厂,也可以满足另一部分对智能座舱的态度相对保守的传统车厂。
在生态构建上,即使斑马可以独家拿到阿里生态的所有API接口,但更加困难的事情还是在是拿到API接口之后。蔡明称之为“两座山”。一是“从APP到Agent”,因为交互模式从触摸变为自然语言+AI,会导致大量服务逻辑和框架需要重构。二是“从手机到车”,服务推荐逻辑因场景不同需彻底改变,例如导航在手机上基于原点距离,在车上则需考虑沿途、路况;音乐在手机上基于个人喜好,在车上则需考虑多人共同喜好、环境情绪等。“这件事,CBSP(内容提供商)是没有任何的道理做的,然后他跟现在的移动互联网相比,他投入太多,收益太小,所以这件事只能由斑马来做。”蔡明说到。
未来的涟漪:重塑行业与体验AutoOmni的发布,其意义远超一款新产品上市,它更像一颗投入湖面的石子,必将激起层层涟漪。
对于用户体验而言,这意味着智能座舱交互范式的根本转变。从需要用户主动思考、并精确发出指令的“被动响应”,转向AI能够察言观色、心领神会、甚至先一步行动的“主动智能”。其最终目标是彻底终结“唤醒词时代”。
对于车企而言,斑马提供的“交钥匙”方案和生态联盟,提供了一个高性价比的选择,使其能以更低的成本和更快的速度,获得行业顶尖的AI座舱能力,从而更专注于车辆本身的制造与用户体验的宏观定义,无需在AI底层技术和大模型研发上进行巨额投入。
而对于整个行业而言,斑马的举动正在推动一种新分工格局的形成。智能座舱的竞争,将从过去单打独斗的“垂直整合”模式,逐渐转向以平台型公司为核心、整合多方优势的“生态竞争”模式。这种模式更符合技术发展的复杂度,也可能催生出更繁荣的应用生态和创新速度。
这不仅仅是技术的迭代,更是交互范式的革命。它打破了智能座舱行业长期以来的“内卷”困局,为整个产业指明了通向“主动智能”的道路。当智能座舱跨过这个临界点,我们迎来的将不再是一个更听话的车,而是一个更懂你的伙伴,一个真正意义上的移动智慧空间。人机共生的新纪元,正由此开启。
来源:钛媒体APP一点号