摘要:在科技浪潮不断翻涌的当下,AI 音频领域正经历着一场深刻变革。中科蓝讯、炬芯科技、全志、恒玄科技、乐鑫科技等一众芯片企业,敏锐捕捉到市场机遇,强势入局 AI 音频市场,纷纷推出适配大模型语音助手的方案。这一举措为儿童语言玩具、AI 耳机等应用市场注入了全新活力
在科技浪潮不断翻涌的当下,AI 音频领域正经历着一场深刻变革。中科蓝讯、炬芯科技、全志、恒玄科技、乐鑫科技等一众芯片企业,敏锐捕捉到市场机遇,强势入局 AI 音频市场,纷纷推出适配大模型语音助手的方案。这一举措为儿童语言玩具、AI 耳机等应用市场注入了全新活力。这些方案打破了传统音频设备一问一答的刻板模式,实现了连续对话,让语言应用更加拟人化。使用者不仅能获得前所未有的体验提升,还将在高频互动中,与设备建立起更强的粘性。AI 音频市场的新篇章,正由这些芯片企业徐徐拉开。
首批5家芯片企业入局AI音频市场AI芯片
在当今 AI 语言应用中,芯片作为硬件,是 AI 系统运行的物理根基,而大模型则如同软件灵魂,二者紧密交织、相辅相成。芯片凭借其强大的计算能力,为大模型的复杂运算提供高效支撑,让海量数据的处理得以迅速完成;大模型则基于芯片的硬件基础,通过精妙的算法和丰富的数据训练,赋予 AI 应用智能交互的能力。
正是硬件与软件的深度融合,让 AI 应用从抽象的概念,摇身一变成为具有鲜活生命力的实用工具,渗透进生活的各个角落,以智能对话、精准翻译、内容创作等多元形式,为人们带来前所未有的便捷与体验 。
据我爱音频网统计,目前首批5家芯片企业入局AI音频市场,推出智能语音助手方案,下面请看详细介绍。以下排名不分先后,按照品牌首字母排序。
AB中科蓝讯
中科蓝讯在这场变革中表现尤为突出。为满足市场对 AI 耳机不断增长的需求,中科蓝讯与火山引擎展开深度合作,其讯龙三代 BT895x 平台已成功完成与火山方舟 MaaS 平台的对接,如今已能向用户提供适配豆包大模型的软硬件一体化解决方案。
讯龙三代 BT895x 平台采用 CPU+DSP+NPU 的多核架构,具备高算力、低功耗的显著优势,能够充分满足 AI 耳机端侧在语音处理、高速音频传输等方面的严苛需求。
中科蓝讯与豆包大模型的合作采用分阶段推进的策略。目前,实时翻译、会议纪要、实时对话等功能已完成适配。在未来,双方还将针对不同使用场景,持续推出更多创新 AI 功能。可以预见,中科蓝讯将持续深耕 AI 穿戴产品领域,不断深化与豆包大模型的合作,为市场带来用户体验更卓越的 AI 穿戴解决方案,携手开启 AI 音频市场的崭新时代。
Actions炬芯科技
在智能语言市场的激烈竞争中,炬芯科技凭借敏锐的市场洞察力,提前进行战略布局,陆续推出多款极具竞争力的解决方案,展现出强大的技术实力与创新能力。
在2024年,炬芯第一代(GEN1)MMSCIM 成功落地。该产品采用先进的 22 纳米制程工艺,每个核可提供高达 100 GOPS 的算力,在能效比方面表现卓越,达到 6.4 TOPS/W @INT8 ,展现出炬芯科技在芯片设计领域的深厚底蕴。
炬芯科技推出的第一代MMSCIM端侧AI音频芯片包括了ATS323X、ATS286X、ATS3262X三个系列,均采用了CPU(ARM)+ DSP(HiFi5)+ NPU(MMSCIM)三核异构的设计架构。其中,ATS323X面向低延迟、高音质的私有无线音频领域;ATS286X面向蓝牙AI音频领域;ATS3262X面向AI DSP领域,为客户提供更纯粹的AI算力。
炬芯科技第一代MMSCIM端侧AI音频芯片,在500MHz的运行频率下可以提供0.1TOPS AI算力,在全矩阵状态下,能效比可以达到6.4TOPS/W@INT8,同时,还支持自适应稀疏矩阵,遇0自动不耗电,从而实现更高的能效比。支持全部主要的AI模型,同时炬芯科技为AI-NPU打造了专用AI开发工具“ANDT”,该工具支持业内主流深度学习框架如TensorFlow、Caffe、TFLite、PyTorch和ONNX等,ANDT是打造炬芯低功耗端侧音频AI生态的重要武器。借助炬芯ANDT工具链轻松实现算法的融合,帮助开发者迅速地完成产品落地。
炬芯科技董事长兼CEO周正宇博士也公开披露了炬芯科技 MMSCIM 路线规划,从这一精心擘画的路线图中,我们可以清晰地看到炬芯科技的技术进阶轨迹。
2025 年,炬芯科技将继续推出第二代(GEN2)MMSCIM。延续 22 纳米制程,GEN2 MMSCIM 在性能上实现了重大突破,相较于第一代性能提升三倍,每个核的算力跃升至 300GOPS,并且能够直接支持 Transformer 模型,能效比也提升至 7.8TOPS/W @INT8,进一步巩固了炬芯科技在智能语言芯片领域的优势地位。
展望 2026 年,炬芯科技将推出采用全新 12 纳米制程的第三代(GEN3)MMSCIM。届时,GEN3 MMSCIM 每个核的算力将达到惊人的 1 TOPS,对 Transformer 模型的支持更为完善,能效比更是进一步提升至 15.6TOPS/W @INT8,彰显出炬芯科技持续引领行业发展的决心与实力。
Allwinner全志科技
全志推出的智能语言解决方案,搭载强大的 AI 大模型,为用户带来极具科技感的交互体验。通过接入先进的 AI 大模型,该方案实现了语音交互、情绪识别、连续对话以及中英双语互动等功能,让沟通更加智能便捷。
在资源方面,方案接入了喜马拉雅语音资源库,涵盖万物百科、歌曲、童话故事等海量内容,为家庭用户量身打造丰富的视听盛宴,满足不同年龄段的需求。
交互方式上,汤姆猫机器人提供了多元化的操作选择,支持语音、按键、手机控制以及屏幕交互等多种方式。不仅能进行日常的语音对话,还设有摸头打断、主动聊天等趣味交互细节,增添更多互动乐趣。值得一提的是,汤姆猫的双眼采用灵动屏幕设计,通过屏幕变化展示多种信息,搭配丰富的眼部表情,精准传达情感,为用户和家庭提供真实的情感陪伴。
硬件配置上,全志 R128 芯片采用 RISC-V XuanTie C906 + Arm CortexM33 双核心架构,具备强大的运算能力。同时支持 WLAN 2.4G + Bluetooth v5.0 双无线通信协议,确保稳定的网络连接。此外,HiFi5 DSP 作为 AI 语音交互专属处理单元,搭配集成的 Audio Codec 及常用音频接口,全方位优化语音处理和音频输出,为用户带来高品质的语音交互体验。
BES恒玄科技
在智能设备飞速发展的当下,智能音频 SoC 芯片作为关键核心,迎来了广阔的发展空间。恒玄科技作为行业内的佼佼者,在智能语言产品领域的布局尤为引人注目。
芯片布局,恒玄科技推出了BES2700、BES2800两款王牌芯片。持续在芯片研发上发力,不断突破制程工艺。值得一提,即将发布的新一代 BES2800 智能可穿戴芯片采用 6nm FinFET 工艺,在图像处理、算力、性能以及功耗等多方面优势显著。
而 BES2700 系列芯片也在智能语言产品中发挥着重要作用,例如搭载恒玄科技 BES2700ZP 的 AI 智能体耳机 Ola Friend 发布,充分展示了公司芯片在 AI 耳机领域的应用实力,为用户带来更优质的语音交互体验 。
以字节跳动为例,搭载恒玄科技 BES2700ZP 芯片的 AI 智能体耳机 Ola Friend 的发布,开启了双方在 AI 耳机领域合作的新篇章。未来,公司与字节跳动等互联网公司有望在更多 AI 耳机产品中携手,由恒玄科技提供核心芯片,进一步拓展市场。
积极接入大模型。随着 AI 技术的不断革新,大模型在智能语音交互中的作用愈发关键。恒玄科技紧跟行业趋势,其推出的 BES2800 集成了低功耗 Wi-Fi 模块,为未来实现云端大模型的接入奠定了坚实基础。一旦成功接入,将极大提升人们与 AI Agent 的交互效率,为用户带来更智能、更便捷的语音交互服务,在智能语言产品市场中抢占先机。
随着 AI 耳机市场的迅猛增长,恒玄科技凭借全面的芯片布局、广泛的大客户应用以及积极的大模型接入策略,业绩有望实现大幅提升,持续巩固其在智能音频 SoC 芯片领域的领先地位。
Espressif乐鑫科技
在生成式人工智能蓬勃发展的浪潮下,大语言模型(LLM)已成为人工智能领域的核心技术,推动着 AI 编程、智能客服、AI 办公等应用场景的落地。然而,将这些技术拓展到端侧设备,面临着计算能力、延时和功耗等诸多挑战。乐鑫科技凭借其领先的无线 SoC 技术,在这场技术变革中脱颖而出,为智能语言产品领域带来了创新的解决方案。
芯片布局早且全。乐鑫科技早在 2019 年上市募投项目时就开始布局端侧 AI,2020 年底发布了第一款带端侧 AI 功能的 AIoT 芯片 ESP32-S3,目前已发布的产品线 ESP32-S3、ESP32-P4 均带有本地 AI 处理功能,能够加速神经网络计算和信号处理等工作,实现高性能的图像识别、语音唤醒和识别等应用,且支持在本地离线运行一些 AI 模型,比如语音识别、人脸识别和移动检测,为智能语言产品提供了坚实的硬件基础。
高性价比优势凸显。在硬件成本方面,乐鑫科技的产品展现出显著的市场竞争力。以ESP32系列芯片为例,其对应的开发板及套件凭借高性价比优势获得开发者青睐。通过电商平台可见,基于该系列芯片的各类开发套件覆盖多样化需求,既有基础配置的入门级产品,也包含集成显示屏、音频输入输出模块等扩展功能的进阶版本。市场反馈显示,搭载智能语音功能的ESP32-S3开发套件已实现逾千套的销售规模,而基础型开发板更创下单月销量破万的市场表现。值得关注的是,配套服务体系包含技术指导与教学资源,有效降低了开发者的准入门槛,为智能语音产品的创新研发提供了经济高效的硬件支持方案。
大模型接入成果显著。乐鑫活跃的开发者生态助力其在大模型接入方面成绩斐然。目前在各大社交平台上,能搜索到大量开发者贡献的基于 ESP 开发平台接入豆包、OpenAI、Deepseek、文心一言、智谱清言、通义千问等大语言模型的方案 demo 及开源项目。2024 年 12 月,乐鑫科技参加火山引擎(字节跳动)相关的技术发布会,联合推广豆包大模型落地在 IoT 设备的相关应用方案,进一步拓展了大模型在智能语言产品中的应用边界。
乐鑫科技凭借其前瞻性的芯片布局、高性价比的产品以及在大模型接入上的积极探索与成果,在智能语言产品领域占据了重要地位,未来有望随着 AI 技术的发展,持续为行业带来更多创新与惊喜,推动智能语言产品市场迈向新的高度。
我爱音频网总结
在当下科技迅猛发展的时代,智能语言助手正以其独特魅力与无限潜力,成为行业关注焦点。
从产品丰富度来看,智能语言助手种类繁多,涵盖了从日常办公到智能家居控制,从教育辅助到医疗健康咨询等各个领域,满足了不同用户群体在多样化场景下的使用需求。无论是忙碌的上班族用于提高办公效率,还是家庭用户享受便捷的家居生活体验,都能找到适配的智能语言助手。
值得一提的是,大模型和芯片的国产化进程取得重大突破。国产化大模型在自然语言处理能力上不断提升,对本土语言文化的理解和运用更加精准,能更好地为国内用户提供服务。同时,国产芯片的崛起,不仅保障了供应链的安全稳定,还凭借不断优化的性能和持续降低的成本,为智能语言助手的大规模普及奠定了坚实基础。这也使得智能语言助手的性价比优势愈发凸显,在提供强大功能的同时,降低了用户的使用门槛,让更多人能够享受到人工智能带来的便利。
展望未来,AI 语言与硬件的深度融合充满无限可能。当智能语言助手搭载在AI智能音箱、AI玩具、AI耳机、AI智能车载系统等各类硬件上时,将会创造出全新的交互体验。比如,AI智能车载系统与语言助手结合,实现更精准的语音导航、车辆状态查询和娱乐系统控制;AI玩具借助语言助手,为小朋友提供实时语言交流,加上IP的拟人化,丰富产品的多样性形态。
这种融合极有可能创造出下一个行业爆款应用,推动人工智能产业迈向新的发展高峰,重塑人们的生活和工作方式,带来前所未有的变革。
来源:我爱音频网