电动车语音交互的极限在哪?能听懂复杂方言和说唱吗?

B站影视 日本电影 2025-03-18 19:42 2

摘要:电动车的语音交互能力取决于语音模型,中国语音模型的训练又堪称奇迹,复杂方言、超快语速早就不是问题,能力不可谓不强。不过,量变到一定程度就会引发质变,你总不能用如此性能的语音模型只是处理这些东西吧?

电动车的语音交互能力取决于语音模型,中国语音模型的训练又堪称奇迹,复杂方言、超快语速早就不是问题,能力不可谓不强。不过,量变到一定程度就会引发质变,你总不能用如此性能的语音模型只是处理这些东西吧?

这几年合资品牌也开窍了,既然中国语音大模型这么强,那就展开合作,基于高性能开发多场景,从而实现差异化的竞争。

不久前测试了广汽Honda P7,就已经意识到合资车企在这方面得不同想法了。实话实说,Honda在智能化方面的着手不算晚,广东作为日系车的大本营,Honda,没记错的话,应该是率先支持粤语的汽车品牌。

广汽Honda P7升级之后的语音包再度拓展,开始支持粤语、川话。为了测试这项能力,知乎请来了电竞解说、相声演员、粤语主持以及说唱歌手,对Honda P7发起了挑战,也就是大家在视频里看到的那样。

广汽Honda P7搭载的Honda CONNECT 4.0,是最新的车机系统,Honda和科大讯飞紧密合作,进一步提升了语音性能,着重提升了语音识别能力。

汽车朝着无机械按钮方向前进的路上,语音识别已经在事实上证明了相比手势拥有更大的优势。语音识别越来越重要,因为是未来车生活的最佳入口。

当然,语音要彻底消灭机械按钮,就需要更加聪明的理解乘客发出的指令,询问更少,繁琐更少。广汽Honda P7此次所做的改进是减少决策链路,让交互逻辑更加深入,增加了免唤醒的功能。

新的办法只要语句中暗含了语音助手功能激活的「密钥」——对广汽Honda P7而言就是「你好本田」。调整空调,可以直接一句「你好本田,空调调整到25摄氏度」,设置导航也可以一句「你好本田,导航回家」。

语音交互的整个过程减少废话,减少询问,前提就是更准确、更快速的识别,这就是我们前面提及的语音助手需要有足够强大的接收和分析能力,能快速分析一连串对话的内容,找到哪些指令是要执行的。

用最少的话,做更多的事儿,基于强大的语音模型,广汽Honda P7新增了编程模式,用户可以提前设定一连串的指令,然后命名,就可以实现一句话实现数十个指令,指令包含座椅调节、空调调节、音乐播放、灯光设置等等。

以我要回家这个场景为例。

我上车之后一般需要设置导航、调整空调、打开音乐,那就可以将这些指令按照先后顺序串联起来,编辑为「上下班模式」。

再比如,无聊等女朋友,我需要座椅平躺、座椅通风、座椅按摩、播放音乐、调节空调并开启氛围灯,此时就可以将这一连串的指令命名为「无聊女朋友」模式,以后只要五个字就能实现所有指令。

编程模式需要系统底层的支持,广汽Honda P7的Honda CONNECT 4.0已经在系统底层将软件和硬件打通,整车硬件实现了数字化,这是智能汽车的生态化的标志。

汽车的竞争或者说定位正在发生改变,以前真的就只是工具,现在的汽车需要了解和理解人类生活,并从一系列的生活习惯中变得「懂你」。没有情绪陪伴价值的汽车不是新汽车,而产生陪伴价值就需要智能,这就是智能化越来越被重视的原因。

智能需要性能,性能就是能力,能力只有强到一定程度才会引发质变。我们很快就会进入一个千人千面千车的时代,从手机到汽车无不如是。不同的使用习惯打造不同习性的汽车,是时候重新定义人车关系了。

新的车与生活的关系,是在除去工具角色外,被人们常常年起,产生越来越多的「被需要感」,所以能听懂复杂方言和超快语速只是性能,算不得什么,发挥这些性能,让人类爱上,更重要。

来源:雅斯顿

相关推荐