昆仑万维发布多款前沿模型,厚积薄发迎商业收获期

B站影视 内地电影 2025-08-16 16:25 2

摘要:8月11日至15日,昆仑万维在SkyWork AI技术发布周集中推出六款覆盖多模态AI核心场景的前沿模型,这不仅是一次技术秀,更是昆仑万维多年来高强度研发投入转化为市场竞争力的集中体现。

在全球AI产业竞争加速的当下,昆仑万维正迎来一个技术与商业同步跃升的关键窗口。

8月11日至15日,昆仑万维在SkyWork AI技术发布周集中推出六款覆盖多模态AI核心场景的前沿模型,这不仅是一次技术秀,更是昆仑万维多年来高强度研发投入转化为市场竞争力的集中体现。

财报数据显示,昆仑万维2024年全年研发费用达到15.4亿元,同比增长59.5%,背后是AI算力芯片、大模型及应用等关键环节的持续加码。

这种“厚积薄发”的策略,让昆仑万维在技术门槛不断抬升的赛道上构建了稳固的壁垒,并迅速将技术突破转化为商业成果。

Mureka V7.5模型上线

不断拓宽的技术长板

作为技术发布周收官之作,8月15日昆仑万维正式推出Mureka V7.5模型。

Mureka V7.5作品《梦想家》

Mureka是昆仑万维AI商业化最成熟、最成功的典范之一。它已经形成了面向C端用户的流媒体平台(Melodio)和面向B端开发者的创作平台(Mureka API)的成熟商业模式。截至2025年3月,其超过1200万美元的年化流水,不仅证明了AI音乐巨大的市场潜力,也为整个AI行业如何将前沿技术转化为实实在在的收入,提供了一个绝佳的范本。

此次发布的Mureka V7.5模型,其核心突破在于构建了深度融合文化语境与语言特性的音乐音频理解模块。该模型通过系统性训练,已形成对中文音乐多样性的全面认知,从传统民歌、戏曲到经典华语流行金曲及当代民谣,均能精准捕捉艺术神韵。

针对中文歌曲的独特表达需求,Mureka V7.5模型在音色与演奏技法上实现质的飞跃。

在生成歌曲的过程中,模型利用优化的ASR技术解析气息、情感和唱法细节,智能划分乐句与换气点,结合精准乐段识别,使人声清晰度、结构感和情感真实度显著提升,机械感降低,更接近真人演唱。

在语音合成领域,昆仑万维推出的MoE-TTS框架,是首个基于MOE的角色描述语音合成框架。该框架创新性融合预训练大语言模型文本能力与语音专家模块,为文本与语音配置专用专家MoE,并在Transformer核心结构中引入模态路由,实现模态独立优化与跨模态信息高效对齐,达成“知识零损失”的泛化理解能力。

MoE-TTS框架

在双测试集评测中,MoE-TTS在风格表现力贴合度和整体贴合度等声学控制维度方面展现出领先优势,尤其在处理比喻、类比等复杂修辞时,生成的语音与用户预期的匹配度显著超越传统模型。

Mureka V7.5模型凭借中文音乐生成的核心竞争力,可广泛应用于音乐创作辅助、广告配乐、游戏音效等领域;MoE-TTS则有望推动行业从“封闭标签式控制”迈向“自然语言自由控制”,在虚拟助手、数字人、有声创作等领域潜力巨大。这两项技术的协同发展,不仅为音乐与语音合成领域提供了技术标杆,更加速了从音乐生成到语音定制的完整生态构建。

技术开花

AI全栈能力的加速突破

SkyWork AI技术发布周上,昆仑万维六款模型的发布,系统地呈现了“All in AGI 与 AIGC”战略的阶段性成果,并为其未来商业布局勾勒清晰的图景。

率先登场的SkyReels-A3模型,是昆仑万维面向音频驱动人像视频生成的全新模型。基于“DiT(Diffusion Transformer)视频扩散模型+插帧模型+强化学习的动作优化+可控运镜”,能够实现任意时长的全模态音频驱动数字人创作。

推出的自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——Matrix-Game 2.0,则在低延迟、高帧率的长序列交互性能上实现突破,可在多场景中以25FPS的速度,生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。

Matrix-Game 2.0是业内首个在通用场景上实现实时长序列交互式生成的世界模型开源方案。同时,也是目前A股唯一对标谷歌Genie的模型,AI产品+模型生态已经产生飞轮效应。

昆仑万维Matrix-Game-2.0宣传图

Matrix世界模型系列中的另一个重要组成模型——Matrix-3D,用于3D世界的生成与探索。从单图像出发,生成高质量、轨迹一致的全景视频,并直接还原可漫游的三维空间,对标李飞飞WorldLabs的生成效果,可实现更大范围的探索空间。短期内,它有望彻底革新游戏开发、影视制作和建筑设计等行业的内容生产流程。长远来看,它将成为通往元宇宙和具身智能时代的关键基础设施。

8月13日发布的Skywork UniPic 2.0,针对多模态生成领域的高效化与一体化难题提出了新范式。Skywork UniPic 2.0由生图编辑、统一模型能力、生图编辑后训练三个核心模块组成,围绕生成和编辑模块轻量化、与多模态理解模型的联合训练,构建了理解、生图、编辑一体化的核心能力。目前,Skywork UniPic 2.0已全面开源,包含模型权重、训练代码、强化策略与量化方案,降低了开发者构建多模态应用的门槛。

此外,天工智能体的进化是此次发布周的另一大亮点。升级的Skywork Deep Research Agent v2,是天工超级智能体(Skywork Super Agents)的核心引擎,在多模态爬取技术MM-Crawler、长距离多模态信息收集、异步并行Multi-Agent多模态理解架构和多模态结果呈现能力四个方面完成技术突破。

通过以上技术创新,Skywork Deep Research Agent v2首次整合多模态检索、理解和生成,把“读文字+看图片”这件看似简单却长期被忽视的事情真正做到位,让研究人员等用户一次拿到信息完整、节奏顺畅、视觉友好的深度报告。

天工超级智能体在检索信息的过程中

自动浏览并分析理解重要的图片

这些模型的升级全部源于解决产品发展中的实际问题,因而具备迭代快、成本优、应用价值高的特点,为产业端AI生产力释放提供高效、开放、可落地的工具集。

重投入研发

人工智能龙头的技术底座

昆仑万维的路线是典型的“厚积薄发”。

近年来,昆仑万维在AI领域的研发投入占比持续上升,覆盖多个前沿方向。这种策略虽在短期内拉高了成本,但在行业周期中,意味着更强的技术储备和更稳的长期竞争力。

昆仑万维在其2024年财报中表示,公司继续坚定践行“All in AGI 与 AIGC”发展战略,持续加大研发投入,全年研发费用为15.4亿元,同比增长59.5%。

进入2025年,昆仑万维的研发投入并未放缓。昆仑万维在一季报中披露,正在全力推进AI算力芯片、大模型及应用的研发迭代工作,整体研发费用同比增长23.4%,达到4.3亿元。

这种研发策略背后的逻辑,是以厚积薄发的方式在AI赛道构建更高的进入壁垒。持续增加研发占比意味着公司愿意在短期承压的情况下,换取更为扎实的技术底座与更广阔的商业化可能性。

这种研发投入与技术积累的价值,在本次SkyWork AI技术发布周也得到了全方位的展示,系统性地揭示了其为跨越商业化鸿沟而精心构建的“渡河之舟”。

商业结果

AI驱动的产业化落地与万亿生态

昆仑万维的模型迭代呈现出一条清晰的从技术到商业闭环的路径:高研发投入带来技术突破,技术突破快速转化为可落地应用,落地应用反过来加速商业化进程,并以收益反哺研发。

事实上,这种模式的成效已经在昆仑万维的多个业务矩阵得到验证。SkyReels、Skywork Agent、Mureka、Linky等在海内外市场的积极反馈,印证了昆仑万维的研发成果具备高转化率。这意味着,昆仑万维已经从以往的“技术探索期”逐步进入到“商业收获期”,并在研发与商业化之间形成了正向循环

2024年,昆仑万维全球整体月活跃用户稳定在近4亿,海外收入占比高达91%。其AI社交业务单月最高收入突破100万美元,成为海外收入增长较快的中国AI应用。

在全球AI产业竞争日趋激烈的背景下,昆仑万维正通过“以技术驱动商业、以商业反哺研发”的双轮模式,构建面向未来的万亿级生态。

(文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)

来源:科技引力一点号

相关推荐