AI视频生成:技术革新与商业化的竞逐之路

B站影视 2025-01-10 08:26 2

摘要:2024年12月30日,爱诗科技旗下AI视频生成模型PixVerse V3.5正式上线,其在生成速度、运动控制、动画效果等方面均取得明显进步,在PixVerse V3.5 Turbo极速生成模式下,最快5秒、平均10秒生成视频,进一步推动AI视频生成的普及。自

导读:2024年12月30日,爱诗科技旗下AI视频生成模型PixVerse V3.5正式上线,其在生成速度、运动控制、动画效果等方面均取得明显进步,在PixVerse V3.5 Turbo极速生成模式下,最快5秒、平均10秒生成视频,进一步推动AI视频生成的普及。自2024年2月OpenAI首次发布AI视频生成模型Sora以来,快手、字节跳动、腾讯、谷歌等多家企业也相继推出了AI视频生成模型,行业竞争愈加激烈。AI视频生成现状如何?商业化进展如何?投融资情况如何?本文尝试分析和探讨。

01 AI视频生成现状

AI视频生成是指利用深度学习、自然语言处理、计算机视觉等人工智能相关技术,自动生成视频内容的过程。相较传统视频的制作,AI视频生成产品具有以下特点:(1)高效性:AI视频生成产品可在短时间内快速产出视频,大幅节省人力和时间成本。例如,制作一个常规的宣传视频,传统视频的制作可能需数天甚至数周时间,但AI视频生成产品仅需几分钟到几小时;(2)灵活性:用户仅需调整文本描述、参数设置等,AI视频生成产品便可根据用户不同的需求和输入条件生成多元化的视频内容;(3)创新性:AI技术为视频创作带来丰富的思路和风格,帮助用户突破传统创作的限制。

AI视频生成技术的发展经历了多个阶段,从最初的图像拼接生成阶段,到GAN(生成对抗网络)、VAE(变分自编码器)、Flow-based(流模型)的应用,再到自回归和扩散模型的兴起。早期的视频生成主要依赖于图像拼接技术,通过将静态图像序列拼接成视频流,但这种方法生成的视频质量较低,连贯性较差。随着深度学习技术的突破,2016年后GAN、VAE、Flow-based等技术开始被应用于视频生成,生成视频的质量和连贯性得到显著提升。2020年以来,自回归模型和扩散模型的出现进一步推动AI视频生成技术的发展,使其生成更加逼真和连贯的视频内容,且应用场景更为广泛。

当前AI视频生成技术逐步从实验阶段迈向实用化,成为AI领域的重要分支。快手、字节跳动、OpenAI、Runway等众多国内外企业和研究机构纷纷投入大量资源进行技术研发和产品创新,推动AI视频生成行业的快速发展。例如,OpenAI发布的Sora可根据文本、图像和视频输入生成高质量的视频,其采用Transformer+Diffusion模型的组合,实现视频生成的连贯性和准确性,验证了Transformer和Diffusion模型结合的有效性,为AI视频生成的研究提供新的思路和方向。

尽管OpenAI率先发布Sora,在AI视频生成领域占据先发优势,但国内企业不断追赶,模型性能持续提升,目前爱诗科技的PixVerse、快手的可灵等AI视频生成模型在综合性能上表现出色,甚至在某些方面已超越Sora。据AGI-Eval(上海交通大学、同济大学等高校和机构合作发布的大模型评测社区),2024年12月,PixVerse-V3、Kling1.5、Video-01的得分(评测维度包括视频-文本一致性、视频质量、运动质量等)超越Sora。

图表 1:2024年12月文生视频模型评测榜单Top10

数据来源:AGI-Eval、RimeData来觅数据整理

AI视频生成领域参与者众多,行业仍处于早期阶段。AI视频生成的主要参与者包括:

(1)大型互联网/科技企业:腾讯、字节跳动、快手、谷歌等全球互联网/科技企业凭借自身在人工智能领域的深厚积累和强大的技术实力,先后推出了多个具有影响力的AI视频生成模型;

(2)初创企业:爱诗科技、生数科技、OpenAI、Pika、Runway等众多初创公司具有创新的思维和技术实力,在AI视频生成领域进行积极探索和创新,为市场注入新鲜血液和活力;

(3)研究机构:央国企搭建的 AI 研究院和新型研发机构,如 TeleAI(中国电信人工智能研究院)、智源研究院等,在政策支持和资源投入方面具有优势,致力于推动 AI 视频生成技术的研发和应用。

但众多企业的入局,也在加剧AI视频领域的竞争程度。自2024年2月Sora发布以来,AI视频生成的产品已有较大的进步,基础生成时长不断增加。同时,这些AI视频生成产品在分辨率、帧率等方面也有较大的提高,生成的视频效果持续提升。AI视频行业技术不断革新,产品迭代速度快,整体市场竞争格局仍较为分散。

02 AI视频生成商业化进展

现阶段,AI视频生成领域正在不断探索商业化路径,主要通过To C端和To B端两种服务模式实现商业化。To C端主要通过提供付费订阅服务,如快手可灵、字节即梦、智象未来(HiDream.ai)等,这些平台提供不同等级的订阅服务,如免费版、标准版、高级版、尊享版,价格为每月数元到数百元不等。To B端则主要通过API接口和解决方案服务,如快手可灵、生数科技、爱诗科技等,服务领域涵盖了影视、互联网、营销广告等,价格为每月数十元到数万元不等。

部分AI视频生成产品在商业化方面已取得初步成果。例如,爱诗科技的核心AI视频生成产品PixVerse在全球的用户数累计已超1,200万,月活跃用户数近600万,其通过C端产品功能不断优化和拓展,如内置数十种特效模版等降低用户使用门槛来实现用户增长和商业变现。

快手可灵累计服务用户超600万,累计生成超6,500万个视频、1.75亿张图片,截至2024年第三季度,可灵的商业化单月流水超千万人民币。HeyGen在2022年9月推出AI视频创作应用后,7个月内 ARR(年度经常性收入)达到100万美元,在2023年底其ARR达1,800万美元。爱诗科技、快手可灵、HeyGen的市场表现,表明了市场对AI视频生成具有较大的需求。

但AI视频生成长期看仍面临商业化困境。在产品层面,AI视频生成产品单次生成的视频时长较短(通常不超过60秒),等待时间较长,同时视频生成效果不稳定,存在事实性错误、一致性不足等问题,其复杂场景、真实感等也有待提升。此外,高昂的计算成本和服务器资源需求也限制了商业化进程。在市场层面,普通用户对视频生成的需求低,自媒体从业者、视频制作者等对视频生成的需求高,但现有产品无法满足其工作需求。而影视行业近3年来较为低迷,目前对AI视频生成的需求也较低。

03 AI视频生成市场规模

AI视频生成的市场规模有望进一步扩大。据Fortune business insights测算,2024年全球AI视频生成市场规模约为6.1亿美元,预计到2032年将达25.6亿美元,2024-2032年的年复合增长率约为19.5%。AI视频生成市场规模持续增长的主要驱动因素如下:

(1)AI生成视频的成本低:AI生成视频的成本远低于现有视频内容的制作成本,据量子位智库数据,顶级动画电影(迪士尼、皮克斯等制作)每分钟的制作成本约达200万美元,而AI视频生成的内容成本每分钟约300美元,降本效果明显;

(2)应用场景广泛:AI视频已逐步在影视制作、广告营销、短视频、电商、动漫等多个领域进行应用,有效提升各领域视频制作的效果,同时降低制作成本;

(3)内容视频化是主流趋势:据QuestMobile显示,截至2024年9月,移动视频行业总体月活用户规模达11.36亿,视频已逐步成为流量的核心形式。此外,在2024年10月的中国移动全球合作伙伴大会上,华为董事长梁华表示,目前在线视频流量占据网络流量的70%,用户对视频内容的依赖度高;

(4)技术创新:深度学习、神经网络、自然语言处理等关键技术的突破,为AI视频生成提供了强大的技术支持,使AI在视频生成和处理时更为高效和准确,进而生成更加逼真的视频内容;

(5)政策支持:随着AI产业的快速发展,国家和地方政府出台了一系列政策文件,在资金、人才、政策等方面均给予大力支持,加快推动人工智能相关技术与产业的融合。

图表 2:2023-2032E全球AI视频生成市场规模(亿美元)

数据来源:Fortune business insights、RimeData来觅数据整理

04 AI视频生成投融动态

AI视频生成领域技术不断迭代升级,逐步可生成视频时长更长、场景更复杂的视频内容,应用范围进一步拓宽,增加了投资者的信心。2024年,全球AI视频生成领域融资规模合计已超600亿元,整体以早期融资为主,行业仍处于快速发展阶段。

同时,知名投资机构、产业投资基金、科技巨头等多元投资主体参与AI视频生成领域的融资,如启明创投参与生数科技的融资,蚂蚁集团、北京市人工智能产业投资基金(北京国管旗下)参与爱诗科技的融资,百度参与生数科技的投资,不同背景的投资主体也为AI视频生成领域的发展提供强大的资金支持和多元化的资源。

下表是2024年AI视频生成赛道亿元及以上投融事件,感兴趣的读者可以登录Rime PEVC平台获取AI视频生成领域全量融资案例、被投项目及深度数据分析。

图表 3:2024年AI视频生成赛道亿元及以上投融事件

数据来源:RimeData来觅数据

本文内容基于来觅数据认为可信的公开资料或实地调研资料,我们力求本文内容的客观、公正,但对本文中所载的信息、观点及数据的准确性、可靠性、时效性及完整性不作任何明确或隐含的保证,亦不负相关法律责任。受研究方法和数据获取资源的限制,本报告全部内容仅供参考之用,对任何人的投资、商业决策、法律等操作均不构成任何建议。在任何情况下,对因参考本报告造成的任何影响和后果,来觅数据均不承担任何责任。

OpenAI o3模型登场,人类离AGI又近一步

999元!智能眼镜的中场战事

ASIC,AI芯片霸权的终结

“天价”疗法迎支付转机

AI Agent:商用爆发元年将至

央企创投基金救场,2025年创投市场将会有哪些新的变化?

玻璃基板:大厂争相布局的AI焦点

国产替代新焦点:半导体设备零部件的低调崛起

巨头抢滩基因编辑疗法

爆发在即!百镜大战已成现实


来源:Wind万得

相关推荐