摘要:过去十年,语音识别技术的演进是线性的:识别更准、响应更快、语调更自然。行业沉迷在“听清楚”这场马拉松里,以为跑得更快就能赢。但AI大模型的降维打击,正把这场马拉松变成短兵相接的巷战:听清楚早已不是优势,听得“懂”、听得“准”、听得“值钱”才是入场券。
过去十年,语音识别技术的演进是线性的:识别更准、响应更快、语调更自然。行业沉迷在“听清楚”这场马拉松里,以为跑得更快就能赢。但AI大模型的降维打击,正把这场马拉松变成短兵相接的巷战:听清楚早已不是优势,听得“懂”、听得“准”、听得“值钱”才是入场券。
2024年初,Sora发布震撼业界,而在同一时间,GPT-4.0的语音能力也悄然更新。你可以用自然语言与AI实时对话,语调、语义、上下文理解都接近人类水平。这并不意味着传统语音厂商要“死”,但这毫无疑问意味着:时代换算法了,换逻辑了,甚至连需求本身都换了。
智能语音的核心不再是“转文字”,而是“变接口”——AI语音正在成为企业业务流程的主动入口。你以为它是客服,其实它在替你判断意图;你以为它是字幕工具,其实它在提取情绪标签;你以为它是语音助手,其实它在替你做决策预判。一切人类对话的边缘,都开始被语音AI渗透。
这是一场由AI重写的产业战局,最先出局的是只会“识别”的玩家,正在崛起的,是那些将语音当作数据引擎、交互入口、业务操盘手的系统型企业。他们不靠识别率讲故事,而是围绕“语音即场景”的打法进行重新建模。AIGC、智能座舱、语音内容生成、医疗记录、金融风控、实时会议协作,语音正在悄无声息地渗透每一个数据密集型行业。
与此同时,整个市场正在发生“上下两头热,中间腰部塌”的格局变化——大厂凭借大模型垄断基础能力,小厂灵活切入垂直场景,而中腰部玩家被夹击:产品同质、模型依赖、业务缺乏闭环,成了AI语音时代最危险的位置。
但危险也意味着重新洗牌的机会。未来真正有价值的语音企业,不是卖“识别引擎”的技术服务商,而是构建“数据交互闭环”的系统级玩家。它们必须兼具算法深度、产品理解和行业洞察,把“能说会听”变成“能懂会干”。
谁在技术上有壁垒,谁在场景里有闭环,谁在业务中能变现,谁就会在大模型时代的语音战场里活下来。
对此,在历经数月的时间里,由数据猿、上海大数据联盟工作人员与外部专家成员联合组成的评选推荐委员会,从众多企业中通过直接申报交流、访谈调研、外界评价、匿名访问等交叉验证的层层筛选推荐机制下,最终制作形成了《2025中国智能语音领域最具商业合作价值企业盘点》。
本期盘点列举了智能语音领域里的一些成熟玩家,主要涵盖企业相关产品及服务介绍、相关荣誉、代表性客户评价等,希望能为读者提供新角度的行业理解。
以下是本期盘点的相关内容:经数据猿整理发布:
以下为本期盘点策划的部分典型性企业详情,排名不分先后:
企业名称:出门问问
企业文化:
·Slogan:更美好AI世界
·定位:人工智能出门问问是一家以生成式AI与语音交互为核心的人工智能公司
·使命:打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AI CoPilot的引领者
·愿景:Make AGI Accessible and AI CoPilot everywhere.
企业简介:
出门问问是一家以生成式AI和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的AIGC工具、AI政企服务,以及AI智能硬件。出门问问致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AI CoPilot的引领者。
出门问问共完成多轮融资,与全球知名投资机构红杉资本、真格基金、SIG海纳亚洲、Google、大众汽车集团等达成投资及战略合作,并于2024年4月24日港交所上市(出门问问 02438.HK),成为“AIGC第一股”。
相关业务及产品服务:
魔音工坊(海外版DupDub)是一款全球领先的集文案、配音、剪辑全流程一站式AI软件,海内外拥有超过800万注册会员,付费会员超60万。魔音工坊拥有千款AI音色,全方言多语种,百变风格适合各类视频创作及配音场景的声音商店;独创的精准调音平台“声音的word编辑器”;以及含声音搜索,声音克隆、生成式TTS“捏声音”等多种创造方式。
代表性客户:新华社、自媒体大V一颗红星(695w抖音粉丝)、力哥影视(1306w+抖音粉丝)
相关荣誉:
魔音工坊写入联通研究院金砖白皮书
创业邦2024年AIGC产品创新榜
2023中国「+大模型」先锋案例 TOP10
出门问问论文入选全球语音技术顶会INTERSPEECH 2023(出门问问与西北工业大学谢磊教授ASLP实验室合作撰写的论文《PromptStyle: Controllable Style Transfer for Text-to-Speech with Natural Language Descriptions》入选)
外界评价:
用了魔音工坊就不想用其他配音软件,就数他方便,配音功能也是丰富多样,配音就像写word文档一样简单方便。
——自媒体大V一颗红星
新华社“夜读”栏目读者反馈热烈,表示内容有共鸣,声音有温度,是睡前的不二选择。(栏目声音由魔音工坊和新华社新媒体中心AIGC工作室联合制作)
——新华社新媒体中心AIGC工作室
★数据猿评价:在语音AIGC陷入模型同质化、功能内卷的红海时,出门问问选择从“工具”跃升为“平台”。以魔音工坊为代表,它不仅构建了一个多语言、多音色、高自由度的声音创作生态,更通过“声音的Word编辑器”等创新功能,率先打通了语音生成的用户体验闭环。背靠自研大模型和全球化产品视野,出门问问是当前极少数真正将语音AIGC做到技术、产品、商业三线合一的玩家,其“AI CoPilot”战略,正让语音不再只是交互方式,而是成为生产力工具的“主控引擎”。
企业名称:声网
企业文化:
·定位:全球实时互动云开创者和引领者,致力于打造生成式AI时代最实时的云
·使命:帮助人们跨越距离实时互动,如聚一堂
·愿景:让实时互动像空气和水一样,无处不在
企业简介:
声网成立于2014年,是全球实时互动云服务开创者和引领者。开发者只需简单调用声网API,即可在应用内构建多种实时音视频互动场景。
声网API已经赋能社交直播、教育、游戏电竞、IoT、AR/VR、金融、保险、医疗、企业协作等20余行业赛道,共200多种场景,单月服务超过700亿分钟;截至2024年12月31日,声网全球注册应用已超93.1万。
声网的实时互动技术服务覆盖全球200多个国家和地区,同时声网遵循国际认可的信息安全和隐私保护标准以及行业要求,致力于采用国际最佳实践来建设隐私和安全管理体系。声网的客户包括小米、陌陌、斗鱼、哔哩哔哩、小红书、Yalla等巨头、独角兽及创业企业。声网的技术同样被HTC VIVE 、The Meet Group、Bunch等遍布全球的知名企业采用。
相关业务及产品服务:
今年,声网发布了全球首个对话式AI引擎。声网对话式AI引擎可支持任意文本大模型快速升级为“能说会道”的对话式多模态大模型。同时,对话式AI引擎的价格也更为优惠,只需0.098元/分钟。
声网对话式AI引擎具备以下功能及优势:
>AI语音秒回:通过全链路深度优化,并在中、美、欧、东南亚主要城市实测,语音对话延迟中位数低至650ms
>选择性注意力锁定:屏蔽95%环境人声、噪声干扰,精准识别对话人声
>智能打断:超低打断延时,自研“智能打断”技术,模拟真人对话节奏,随时打断与AI的对话,响应低至340ms
>全模型适配:支持包含DeepSeek、ChatGPT等在内的全球几乎所有大模型厂商,更有音视频SDK支持30000+终端机型适配,解决多设备兼容性的后顾之忧
>不惧弱网:地铁、地下车库等弱网环境下,人与AI也能流畅对话,80%丢包率下仍能稳定流畅对话,断网3-5s依旧流畅对话
>开发省心、更省钱:声网对话式AI引擎提供了极简的开发部署,只需2行代码,15分钟就能让AI开口说话,大幅降低了开发门槛。只需填入与复制LLM与TTS相关的URL与Key,就能实现快速部署,具体流程可查看声网官网的文档中心
代表性客户:MiniMax
相关荣誉:
2024人工智能年度领航企业
2024人工智能年度杰出解决方案
CSDN2024中国开发者影响力年度评选创新产品与解决方案
大模型之家2024年度奖项评选优秀应用方案榜单
2024年产业AI数字化金铲奖
外界评价:
声网与MiniMax共同打造了国内首个Realtime API实时交互服务方案,综合效果可对标GPT-4o。
★数据猿评价:在AI语音竞逐多为“谁更像人”时,声网另辟蹊径,押注“谁更快反应”。作为全球实时互动云的开创者,声网并不试图与大模型厂商正面竞争,而是以对话式AI引擎构建AI语音时代真正的“实时操作系统”。650ms延迟、340ms打断、80%丢包下仍可对话的韧性能力,让其成为AI从“可聊”迈向“可用”的底层加速器。在AI语音场景普遍落地难、成本高的当下,声网正凭借极致的实时性和极简接入逻辑,把“语音能力”变成“产品能力”的通用接口,工具的“主控引擎”。
企业名称:网易云商(网易数智旗下)
企业文化:
·定位:AI驱动的服务营销一体化平台
·使命:用最好的技术和服务,助力客户内生成长,共创美好世界
·愿景:成为最具价值的智慧科技公司,帮助各行各业的组织,连接和服务10亿人企业简介:
企业简介:
网易云商是网易数智旗下的服务营销一体化平台。2016年从客服SaaS产品七鱼起家,整合云计算、大数据、人工智能等新兴技术,目前已形成三大产品体系:七鱼智能客服、智能洞察、私域增长。
2022年2月,网易云商智能外呼产品正式上线,为企业打造科学策略驱动下的会员触达体验。截至2025年3月,累计稳定外呼通话数量15亿+,服务客户数量9000+,为零售、游戏等行业客户创造营收增量上亿元。
相关业务及产品服务:
网易云商智能外呼是一款多轮交互、代替人工自主呼叫的智能机器人,深度应用网易自研的语音语义顶尖算法,结合AI大模型能力,最新升级推出视频外呼、外呼智能体等创新应用。
实施过程中,帮助企业基于网易人群大数据形成精细化的外呼策略,适用于品牌零售、游戏、企服、会展等行业中的新客增长、留存激活、流失挽回、通知调研等海量场景,能显著降低人力成本,让运营更加精准高效,为企业创造更多营收增量。
代表性客户:大润发、百丽、波司登、江南布衣、网易游戏、37手游、华墨展览等
相关荣誉:
虎嗅大鲸榜·2024 AIGC 数字营销技术商TOP15
2024未来数商大会·2024数商典型应用场景“乘数榜”
2023To B行业影响力价值榜·创新力产品榜
外界评价:
网易云商的智能外呼在实际运营中性能稳定、可靠,是众多同类产品中的可信赖的选择,也确实在新游预约、流失召回等场景上为我们带来了实实在在的增长。
——37手游
在外呼项目中,网易云商不仅能够及时与我们进行有效沟通,还能主动发现外呼话术、外呼策略中的问题及可优化项并提出相应的解决建议,他们的认真负责和专业精神为外呼项目的顺利推进提供了重要保障。
——大润发
★数据猿评价:在“语音+AI”逐渐从技术卖点转向ROI考核的今天,网易云商用一套商业闭环给行业上了一课。从七鱼客服到智能外呼,从语义引擎到大模型驱动的视频外呼,网易云商不再单纯讲“听得懂”,而是围绕“叫得准、说得值、转得动”构建出一整套智能营销操作系统。在用户增长、召回、转化这些最贴近企业利润表的场景里,它用15亿+通话跑出一条可复用、可扩展、可交付的AI变现路径,是语音赛道里极少数真正把“服务”变“营收”的实战派玩家。
企业名称:追一科技
企业文化:
·Slogan:更美好AI世界
·定位:人工智能和AI员工解决方案提供商
·使命:更美好AI世界
·愿景:让AI员工服务每个组织和个人
·价值观:正直 卓越 共赢
企业简介:
追一科技是一家致力成就客户价值的领先NLP人工智能公司与AI员工解决方案提供商,拥有自研的领域大模型追一博文,并拓展到智能语音多模态的AI全栈技术。
公司累计服务超过 300 家中大型企业/政府类客户,助力客户在服务、营销,运营等多个场景上实现智能化转型升级。2023年7月,追一科技获得国家级专精特新“小巨人”企业称号。目前,公司在深圳、上海、北京、成都等地均有专业服务团队。
相关业务及产品服务:
追一科技提供语音识别(ASR)和语音合成(TTS)等一站式智能语音解决方案,统称IVC(Intelligent Voice Cloud),除底层能力以外,同时也提供一系列引擎管理以及运营运维能力,包括语音运营管理平台,自学习平台以及标注平台等。
追一科技的IVC面向语音交互场景、金融运营商和政务领域,专门训练和优化,获得比通用语音识别更好的技术指标。
代表性客户:浦发银行、招商银行、合肥12345热线、广发银行、中国移动等
与大连税务局合作的数字人或国务院颁发的《优化营商环境专项督查发现典型经验做法的通报》
金融赛道算法模型或BPAA大赛全场大奖(冠军)
创业邦2024年AIGC产品创新榜
2024年IDC中国新兴金融科技50强
2024福布斯中国人工智能科技企业
华为昇腾技术验证
外界评价:
追一科技的AI机器人表现非常高效,其全新UI交互界面、语义分析能力、意图识别上下文关联、多类型的富文本答案、配置管理功能、多渠道的快速接入与区分以及任务型等功能都给我们业务提升了解决效率。
——某城商行呼叫中心经理
现在各项税费优惠政策频出,我们公司很多员工都不太了解今年新推出的个税汇算政策,就有人推荐我安装了税可思,不仅方便了我们会计,也方便了我们公司员工,使用更方便,解答效率更高。
——大连市市民
★数据猿评价:在智能语音迈入“理解力为王”的下半场,追一科技不再满足于做技术工具的提供者,而是走在“AI员工系统化落地”的前线。凭借自研的“追一博文”领域大模型和完整的语音交互云(IVC)方案,追一跳脱了语音识别的基础竞争,转而构建“AI助理即业务节点”的解决路径。在金融、政务等高复杂场景中,其语音产品不仅“听得清”,更能“听得准、干得稳”,是为数不多真正将语音能力嵌入组织运营流程的实干型玩家。
来源:数据猿一点号