摘要:技术突破叠加社交互动融合开启行业二次革命。2025 年 9 月 30 日,OpenAI 发布 Sora 重大升级版本——Sora2,以及基于该模型的社交应用 Sora App。 与 2024 年 2 月的第一代产品相比,Sora2 实现了三个层面的技术突破:1
1、Sora2 开启行业二次革命,国内外多模态能力逐步提升
技术突破叠加社交互动融合开启行业二次革命。2025 年 9 月 30 日,OpenAI 发布 Sora 重大升级版本——Sora2,以及基于该模型的社交应用 Sora App。 与 2024 年 2 月的第一代产品相比,Sora2 实现了三个层面的技术突破:1)物 理世界的拟真突破,精准模拟水流、光影、重力与碰撞效果,处理浮力与重心转 移等复杂物理场景,提升了人物动作的连贯性与主体稳定性;2)多模态融合, 可直接生成同步音频,自动匹配环境声、动作音效与多语言对白;3)初步具备 了导演的叙事逻辑与剪辑师的镜头调度能力。 除此之外,Sora2 更具颠覆性的突破在于同时发布的社交应用 Sora APP,让 AI 视频不再局限于“生成工具”,而是更具互动属性和普适性的社交应用。应用内 各类功能支持用户对热门视频进行二次创作并发布,也支持用户生成虚拟形象植 入生成作品中,这类功能极大地增强了互动性和趣味性,更简单的操作也进一步 降低了使用门槛,让用户共创和分享更为便捷,实现“社交裂变”传播。在此机 制下,即使采取邀请制,Sora App 在上线首日仍迅速攀升至美国 App Store 总 榜第三名,达到 5.6 万次的安装量,上线三日登顶榜首,超越了 ChatGPT 和 Gemini,七天获得 62.7 万 iOS 下载量,超越 ChatGPT 首发时的表现。
2、技术更迭催生“AI 漫剧”等创新产品形态,应用场景不断扩张
AI 浪潮下垂类应用百花齐放,国内外多模态能力逐步提升。从 2022 年 11 月, OpenAI 推出聊天机器人 ChatGPT,到 2024 年轰动行业的 OpenAI Sora 第一代 发布,再到 2025 年 9 月的 Sora2 升级发布,回顾各领域垂类应用的发展过程, 其本质都可归结为 AI 大背景下的多模态 AIGC 技术变革。多模态经历了最早的 文生图(Text-to-Image Generation)、文生音乐(Text-to-Music Generation)到 文生视频(Text-to-Video Generation)的更迭过程,随着技术在质量、时长等方 面的成熟和突破,其在影视、游戏等细分领域内容创作过程中的应用渗透率持续 提升,极大地提升了制作效率,加速了优质供给产出。 互联网平台激励政策频出,AI 渗透率迅速提升。随着国内外多模态能力加速升 级,AI 视频应用不再局限于专业工具,而是逐步深入 C 端用户群体,在互联网 平台掀起新的创作风潮,在此过程中,字节、快手、腾讯等互联网平台正通过技 术扶持、流量倾斜和分账方案等方式激励 AI 视频内容创作,提升长短视频平台 AI 内容渗透率。具体包括:1)字节跳动,先后推出“AIGC 短剧招募计划”、 “漫剧扶持政策”、“AI 创作浪潮计划”等激励政策,从源头的番茄小说 IP 库、 中期的资金和制作扶持,到终端的抖音、红果等多渠道分发和超高分成,提供从 创作工具、课程培训到流量资源、行业机会的全链路支持;2)快手:借助可灵 AI 给予技术支持,以高分成激励提升平台内 AI 内容渗透率,推出“灵感·新纪 元 AIGC 创投计划”,覆盖算力成本,投入亿级流量,提供最高 90%分账,进一 步激活创作者动力。3)腾讯:发力 AI 短剧等赛道,2025 年 10 月创办腾讯视频 AI 创作大赛 i 短剧,通过高额奖金和签约机会鼓励将 AI 深度应用于短剧赛道, 探索规模化精品内容生产模式。
技术迭代催生“AI 漫剧”“AI 短剧”等内容形态创新。目前国内代表性 AI 视频 应用包括字节旗下即梦、快手旗下可灵、腾讯旗下混元等,随着内容制作方、平 台方与 AI 内容的结合度进一步加深,AI 内容在各视频平台渗透率持续上升,也 催生了包括 AI 短剧、AI 漫剧等创新内容形态,行业供需同步爆发,带来新的产 业机会。例如,腾讯动漫近期上线 AI 漫剧作品《传武》及《我的治愈系游戏》, 其中《传武》改编自阅文集团旗下腾讯动漫同名漫画,《我的治愈系游戏》改编 自阅文集团旗下起点读书同名小说,两部作品全程由即梦 AI 制作,核心团队仅 有 7 人,20 多集制作周期仅一个月,上线 4 天播放破千万,效果精良,收获了 用户广泛好评;AI 短剧方面,68 集 AI 真人短剧《奶团太后宫心计》近期在抖音 等平台累计播放突破 2 亿,“国内首部付费 AI 短剧”《兴安岭诡事》上线不到 21 小时播放量即破千万,抖音原生端收益超过 30 万,账号涨粉 10 万+。AI+漫 剧、AI+短剧在内的新兴作品形态正逐步成为新的流量聚集地。
“短平快”叠加低成本,AI 视频应用革新漫剧创作范式。根据巨量引擎,2025 年上半年,漫剧供给量以 83%的复合增长率快速扩张,近半年累计上线漫剧 3000 部,环比增长 603%,播放量实现 92%的复合增长,整体市场规模预计在今年创 新高;与此同时,漫剧相关企业数量也同样呈指数级扩张,预计将突破数十万家。 漫剧是将静态漫画、小说文本等素材转化为动态作品形式的非真人视频短剧,目 标用户初期偏向二次元年轻用户,随着题材扩张逐步覆盖至更大范围的用户群体。 漫剧制作成本较低,具备“短平快”的特征,可视为小说及短剧行业的有效结合。 在过去,纯 2D 及 3D 动画的制作成本较高,而 AI 可用于规模化生成素材,大大 降低制作成本和时间投入,同时相比真人短剧,漫剧本身对 AI 生成角色画风形 象、动作精确度等方面包容性更强,AI 内容的可使用率也相对更高。近期长、中、 短视频平台及优质 IP 方均加快了 AI 漫剧布局,如芒果 TV 启动“AIGC 微短剧 创作者生态计划”提供 IP、AI 工具及流量扶持,阅文开放十万部精品 IP 并推出 “漫剧助手”等 AIGC 工具,爱奇艺公布漫剧合作激励计划等,随着国内供给爆 发,有望催生产业链内包括平台方、IP 方、内容方等更广阔的受益机会。
1、早期发展阶段:扩散模型为主,开启多应用场景落地探索
扩散模型是目前 AI 视频生成的主流技术路径,在语义理解、内容丰富程度上均 有突破。2022 年 4 月,Video Diffusion Model 推出,标志着扩散模型在视频生 成领域的应用正式开启。但是扩散模型具有采样速度慢、计算消耗大等问题,在 建模时间维度时通常效果较弱,生成视频动作幅度小,连贯性差。针对这一问题, 2023 年,扩散模型被成功扩展至时间维度,形成时空扩散架构,即在扩散过程 中时间与空间的建模协同进行,代表模型有 2023 年 6 月 Runway 发布的首个商 业化文生视频模型 Gen-2,其所应用的时空联合扩散(Spatio-Temporal Diffusion) 架构能够同时对每一帧画面的内容和帧与帧之间的动态关系进行建模,从而确保 了视频在时间上的逻辑连贯性与流畅度。
AI 原生多模态与视觉语言融合,开启多应用场景落地探索。这一阶段,随着多 模态技术迭代的重心从模型能力的突破转向实际应用场景探索,各类大模型开始 在内容创作、知识检索、交互智能、影视与教育等场景落地。例如,阿里云于 2023 年 8 月推出的大规模视觉语言模型 Qwen-VL,支持图文输入及视觉定位、 图像文字理解等功能,可应用于知识问答、文档分析、识人辨物、内容创作等场 景;2023 年 12 月 6 日,谷歌 DeepMind 发布 Gemini 1.0,作为谷歌“最强大、 最通用的模型”,具备原生多模态特性,支持归纳并流畅地理解、操作以及组合 不同类型的信息,具备空间逻辑推理、时间线推理、图文理解等能力。
2、突破阶段:Sora 引领 DiT 模型,向专业级生产工具迭代
Sora 引领 DiT 模型,多模态取得跨越式进展。2024 年开始,国内外多模态产品 迭代加速,视频生成模型在“时空一致性”与“物理真实性”方面实现跨越式进 展。在过去,视频生成模型只能生成数秒级的片段,缺乏对光影反射、物体惯性、 空间深度等真实物理规律的建模,而 2024 年 2 月,OpenAI 发布了革命性的视 频生成模型 Sora,模型核心基于 DiT 架构(Diffusion Transformer),是一种结合 了 Transformer 架构的扩散模型,其将扩散模型与潜空间压缩相结合,通过时空 补丁(spacetime patches)机制在潜空间中实现帧间动态一致性,显著增强了 模型的世界理解与物理模拟能力。DiT 架构模型在表征层表现突出,当前包括快 手可灵、Runway Gen-3、Luma Dream Machine 等主流模型多基于 DiT 架构在 进行持续迭代。据腾讯 AI Lab、Artificial Analysis 评测和用户反馈,闭源模型当前表现持续领先。
AI 视频向实时交互与专业级内容生产工具演进。Sora 问世后,国内外多模态大 模型迭代显著加快,除实现真实世界建模外,AI 模型的上下文处理能力也从数十 万级词元跃升至千万级别,不仅能处理海量文本,还能对长视频、长音频、多章 节逻辑链进行综合分析,实现了从“问题回答”到“世界理解”的功能转变。除 此之外,多模态开始从单向生成走向实时交互与专业内容生产阶段。支持跨模态 实时生成与反馈,成为多媒体生产力工具的核心支撑。例如 2024 年 5 月发布的 GPT-4o 支持以端到端架构实现全模态实时交互,接受文本、音频、图像和视频 的任意组合作为输入,并生成文本、音频和图像输出的任意组合,可以在最短 232 毫秒内对音频输入作出响应,接近在对话中的人类响应时间。
3、应用落地阶段:从专业工具到社交应用,AI 内容渗透率加速提升
AI 视频与社交功能结合,大众化传播方式加速商业化落地。2025 年,基于此前 阶段的技术突破,大部分 AI 视频模型已经能够支持真实世界模拟、实时响应、 多模态理解等功能,而对于下一阶段而言,如何实现更广泛用户群体的触达,让 AI 视频工具成为真正的 C 端应用,为商业化变现奠定基础成为关键因素。这一 阶段部分AI视频产品已经能够以音画一体的技术突破为基础,内嵌于社交应用, 与社交属性实现深度融合。2025 年 9 月,OpenAI 发布 Sora2,核心突破在于通 过 3D 物理引擎式建模,实现复杂动作、刚体与流体的动态交互,如“体操运动员 在桨板上后空翻”,生成的视频在物理连贯性和视觉真实感上接近真实拍摄,同 时支持画面与背景音效同时生成。
除此之外,Sora2 更具颠覆性的突破在于 OpenAI 同时发布的 Sora APP,让 AI 视频不再局限于“生成工具”,而是更具互动属性和普适性的社交应用,各类功 能支持用户对热门视频进行二次创作并发布,也支持生成虚拟形象植入生成作品 中,这一机制让 AI 视频的创作过程融入了社交属性,实现快速社交裂变传播。 具体功能包括:1)混剪 Remix:允许用户对他人或自己生成的视频进行二次创 作,如替换角色、改变风格、扩展故事等,极大地降低了视频创作门槛。2)互 动与出演:用户可以将自己或朋友的"形象"置入到 AI 生成的视频中参与互动,即 "客串"功能。3)社区互动:内置社区功能,方便用户分享创作、浏览他人作品 并参与趋势挑战,凸显社交和 UGC 属性。与此同时,国内社交各类互联网平台 也逐步开始加大对 AI 内容的支持力度,如抖音携手即梦发布“AI 创作浪潮计划”, 给予优质 AI 内容专项资源扶持,旨在进一步提升 AI 技术对创作者的赋能,提升 平台 AI 内容活跃度和用户参与度。
1、海外产品:技术实力强劲,聚焦前沿开源生态丰富
1)Sora
Sora 由 OpenAI 在 2024 年 2 月发布,模型大小适中,参数量为 30 亿,能够保 持较高的运算效率。适中的模型大小使得 Sora 能够在各种计算设备上运行,为 广泛的应用场景提供了可能。OpenAI 于 25 年 9 月 30 日发布重大升级版本——Sora2,以及基于该模型的社交应用 Sora App。与前一代相比,Sora2 实现了三 个层面的技术突破:1)物理世界的拟真突破。Sora2 能精准模拟水流、光影、 重力与碰撞效果,甚至处理浮力与重心转移等复杂物理场景,极大提升了人物动 作的连贯性与主体稳定性;2)多模态融合。Sora2 可直接生成同步音频,自动 匹配环境声、动作音效与多语言对白;3)初步具备了导演的叙事逻辑与剪辑师 的镜头调度能力。 Sora 能够在模型能力上超过行业平均水平,主要得益于以下方面的技术突破:1) 基础架构采用创新 DiT 混合模型,使得 Sora 能够生成高质量、高分辨率的视频 内容,同时保持较高的处理速度。2)具备强大的视频生成功能。采用将视频和 图像数据转化为统一表现形式的方法,提升数据集训练效率,深度模拟真实物理 世界,包括展示多个角色、特定运动的复杂场景等。3)语义理解上也具备优势。 通过 Dall·E3 中采用的视频再描述(re-captioning)技术获得大量配有描述文本 的训练视频数据,能够理解并执行详细的文本指令,提升文本生成视频的质量。
2)Pika
Pika 1.0 由 Pika Labs 在 2023 年 11 月发行,具备多种强大的功能,主要包括: 1)视频生成与编辑:Pika 能够根据用户的指令生成各种风格的视频,包括 3D 动画、动漫、卡通和电影等。用户还可以选择延长现有视频的长度或将其转换为 不同的风格。2)AI 编辑功能:Pika 提供了 AI 编辑工具,用户可以利用这些工 具更改视频内容的细节,如角色的服装或添加新角色,实现复杂且个性化的视频 编辑和创作。3)创意转视频:Pika 支持用户上传自己的创意想法,并自动将其 转化为相关的视频内容。无论是旅游博客文章、产品设计草图还是婚礼主题和音 乐,Pika 都能快速生成符合用户需求的视频。
3)Runway
Runway 旗下视频生成工具主要包括 Gen-1、Gen-2。Gen-1 于 2023 年 2 月推 出,立足于风格迁移技术,能够通过应用文本提示或参考图像中指定的风格,将 现有视频转化为新视频,但生成视频质量不足,难以作为完整的成片交付使用。 在此基础上,Runway 于 2023 年 6 月推出了 Gen-2,在 11 月发布 Gen-2 生成 4K 高清视频的更新升级。相比 Gen-1,Gen-2 实现了跨越式升级,支持提示词 一键生成超写实视频,在分辨率、细节上均实现突破。 Gen-2 主要支持功能包括:1)图像生成与处理:用户可利用其 AI 算法创建新的 图像、修改现有图像或进行风格转换,为视频制作提供更多的素材和选择。2) 3D 内容创作:支持 3D 模型的生成、编辑和渲染,以及实时 3D 场景的构建和交 互。这使得用户能够创建出更加逼真和生动的视频内容。3)一键式智能处理: 提供了一键式智能处理功能,能够自动优化视频质量和色彩效果,节省用户的时 间和精力。4)多平台输出:支持多种视频输出格式和分辨率,用户可以根据需 要将视频上传到社交媒体、分享给朋友或发布到专业平台。
4)Google Veo 3.1
Veo 3.1 模型由谷歌发布,在视频生成方面取得了显著进步,在音频输出、精细 化编辑控制、图像转视频效果等方面均有提升,能够生成音画同步、画质高达 1080p、时长 8 秒的高清视频。与前一代 veo3 模型相比,veo3.1 的提升点包括: 1)画质与真实世界模拟效果提升:画面细节、光影效果及物体运动轨迹模拟更 精准,效果更接近真实世界;2)效果控制编辑功能升级:新增首尾帧和多图参 考功能,支持精准风格把控,场景延伸功能突破时长限制;3)音频处理能力提 升:支持音画同步生成,提升专业内容制作效率。 用户可以在 Google 的 flow、Gemini 和 lovart 等多个平台上使用该模型。在 flow 平台上,用户可以通过文本转视频、图片转视频以及多图融合转视频等方式生成 视频。使用时,只需选择 veo3.1-fast 模型并输入提示词即可快速生成;Gemini 平台同样支持 veo3.1 模型,用户进入页面后可直接体验视频生成;lovart 平台则 提供了更灵活的视频生成选项,用户可以新建项目后选择视频生成器,设置视频 比例、时长和分辨率等参数。
2、国内产品:场景化能力优秀,本土适配及效率表现突出
1)可灵
可灵由快手发行,于 24 年 6 月 6 日发布全球首个 DID 架构的 V1.0 版本,截至 目前已完成三十多次产品及模型迭代,发布了 V1.0、V1.5、V1.6、V2.0、V2.1、 V2.5Turbo 等大版本模型,核心效果持续处于行业领先。可灵 AI 基于快手自研 可灵 2.5 Turbo 模型,提供具备稳定性更强的高质量视频、及图像生成和编辑能 力,支持「首尾帧稳定丝滑的画面衔接」「多图参考指定角色生成视频」「拥有 百余种风格」,满足创作者在想象力发挥以及对创意素材生产与管理的需求。
2)即梦 Dreamina
即梦 Dreamina 由字节跳动发行,核心功能是帮助用户根据文本或者图像,生成 创意视频,具备画面识别准确、动态丰富、创新性强等特点,支持多种风格的视 频生成,如动漫、写实、摄影和插画等,其中首尾帧相连的功能是即梦的一大创 新点,为用户提供了更多的创作可能性。即梦主要支持以下功能:1)图生视频 与文生视频:用户可以根据图片或文本描述生成创意视频,支持多种风格,如动 漫、写实、摄影和插画等。2)尾帧功能:允许用户上传首尾两张图片,实现 AI 生成补帧画面,增强视频内容的一致性。3)视频功能控制:提供基础的运镜控制、视频比例和运动速度调节功能,使用户能够更灵活地调整视频效果。4)中 文语义理解:相较于其他 AI 视频生成产品,即梦对中文语义的理解更为精准, 更适合中文用户使用。
3)Vidu
Vidu 由生数科技联合清华大学在 2024 年 4 月发布,作为中国首个长时长、高一 致性、高动态性视频大模型,其技术特点和应用潜力有:1)模型架构创新:采 用原创的 Diffusion 与 Transformer 融合架构 U-ViT,结合了 Diffusion 模型的生 成能力和 Transformer 模型的感知能力,为视频内容的生成提供了强大的技术支 持;2)高清视频生成:Vidu 支持一键生成长达 16 秒、分辨率高达 1080P 的高 清视频内容;3)文化适应性:重点理解和展现中国元素,如熊猫、龙等,在文 化表达上更具多样性和深度;4)多镜头与时空一致性:在不同镜头之间保持高 度一致性,有利于制作叙事连贯的视频内容,实现不同镜头的切换;5)动态场 景捕捉与物理模拟:能够捕捉和渲染动态场景,包括复杂的动作和物体运动。
4)WHEE
WHEE 由 美 图 公 司 基 于 其 自 研 视 觉 大 模 型 MiracleVision4.0 推 出 , MiracleVision4.0 版本迭代主打 AI 设计与 AI 视频功能,并于 2024 年 2 月上线美 图公司旗下应用“WHEE”。MiracleVision4.0 版本的视频功能主要包括文生视 频、图生视频、视频运镜、视频生视频,其生成能力已能融入行业工作流,尤其 在电商和广告领域表现突出。在电商行业,MiracleVision 能够快速制作大量商品 视频,使商品展示更加灵动且质感高级;在广告行业中,MiracleVision 能够制作符合产品特性的创意视频,跳出套路,使品牌理念深入人心。通过 MiracleVision 的四大功能,用户能够轻松实现视频内容的创作和编辑,为电商和广告等行业提 供了高效、创新的解决方案。
5)Pixverse
PixVerse 由爱诗科技发行。爱诗科技拥有来自清华大学、北京大学、中国科学院 等顶级学府的团队成员,在计算机视觉、机器学习、计算机工程和算法设计等领 域具备丰富的经验与技术储备,致力于为用户提供创新且实用的 AI 工具,其中 PixVerse 便是其最新力作。 PixVerse 具备多种功能,以满足用户的不同需求,支持文本生成视频和图片生成 视频两种方式,用户可以根据个人喜好和创作需求选择适合的生成模式。同时, PixVerse 内置了多种动画风格,包括写实、动画、3D 动画和 CG 游戏风格,用 户可以根据需要选择合适的风格。此外,它还具备高效压缩技术和画质提升功能, 能够在保持视频质量的同时减小文件大小,并将视频提升至 4K 超高清分辨率。
1、AI 视频与社交互动深度融合,消费级应用落地有望加速
文生视频工具与社交互动结合,催生 C 端应用商业化机会。经历了文生视频从 GAN 模型到基于 Transformer 的自回归模型、扩散模型的演变迭代,下一阶段 的文生视频工具将不再局限于专业工具,而是进一步产品化,与社交互动深度融 合,加速 C 端应用落地商业化。以 OpenAI 推出的 Sora2 为例,其突破并非单 纯依靠技术更迭,更多的是通过创新功能设计和操作简单化,将 AI 视频工具转 化为更贴近用户的社交互动应用,定位为全 AI 内容社交平台,所有内容均由 AI 生成,采用信息流推荐机制,用户创作与消费均围绕 AI 内容展开。其中“客串 (Cameos)”和“混剪(Remix)”功能极大地增强了互动性和趣味性,更简单的 操作也进一步降低了使用门槛,让用户共创和分享更为便捷。Sora App 在上线 首日迅速攀升至美国 App Store 总榜第三名,达到 5.6 万次的安装量,上线三天 登顶榜首,上线七天获得 62.7 万次 iOS 下载量,这一数据已经超越了 ChatGPT 当初的表现,也进一步印证了产品化对 C 端 AI 应用商业化推进至关重要。
2、ChatGPT 向生态系统演进,AI 视频集成平台化程度有望提升
ChatGPT 向操作系统方向演进,文生视频工具集成化、平台化程度有望提升。 2025 年 10 月,OpenAI 在年度发布会上推出了名为 “Apps inside ChatGPT” 的功能,宣布 ChatGPT 将向第三方应用全面开放,以平台化方式为开发者和用 户带来全新体验,而 ChatGPT 也将从单纯的对话工具逐渐演变成为覆盖多样化 领域的全能生态系统。在此过程中,各类文生视频工具也有望接入以 ChatGPT 为代表的生态系统,实现集成化、平台化以及更大范围的用户触达。首批接入的 包括 Spotify、Coursera、Canva、Figma 等 12 家平台,涵盖了从音乐推荐、 在线教育、PPT 生成到设计编辑的全场景。平台化的演变不仅意味着更多的第三 方应用用户触达,也意味着用户交互方式的根本性改变。例如,当用户要求创建 个性化歌单时,ChatGPT 支持直接连接 Spotify,根据用户喜好自动生成并保存 播放列表;用户提出设计海报的需求时,可以在聊天框中@Canva 并提供指令, ChatGPT 支持通过 Canva 生成多个选项供选择;多应用的实时响应意味着用户不需要再在不同应用之间来回切换,大大节省了时间成本和用户教育成本,也标 志着 AI 应用与用户之间的交互模式将逐步从“被动响应”转向“主动服务”。 文生视频模型集成化发展,从简单工具向“生成-分发-变现”全链路平台转化。 除 ChatGPT 类的生态系统能够帮助各类视频生成工具实现平台化以外,文生视 频工具本身的发展也逐步趋向集成化、平台化,比起单纯的视频生成工具,更趋 向于和各类应用场景结合,实现一键打通。例如快手可灵模型尝试与快手商家后 台打通,实现一键生成产品视频并直接投放;腾讯混元视频则侧重在 IP 内容与 影视广告中实现半自动生成;即梦 AI 与抖音创作平台打通,一键生成的内容可 直接进行投流。这种平台化趋势让内容真正流动并产生更高价值,对于解决当前 AI 视频生成与商业化变现的生态断层问题至关重要。
3、AI 视频与 AI Agent 深度结合趋势凸显,一站式解决视频创作需求
视频工具与 AI Agent 结合趋势渐显,一站式解决视频创作需求。AI Agent 可以 承担传统流程中许多重复性、耗时的任务,也同样能大幅简化文生视频的操作过 程。AI 对视频创作本身的提效作用已十分明显,但多模态产品百花齐放同样带来 了一定的复杂性,单应用可能无法同时支持脚本生成、文生图、图生视频、剪辑 配音等所有流程,独立应用之间切换存在不便,用户学习成本较高,而文生视频 与 AI Agent 的结合则有望重构视频生产范式,一站式解决视频创作需求。如美 图公司于 2025 年 7 月近期推出的图像 AI Agent“RoboNeo”,集成公司自训练 垂直小模型及行业主流多模态大模型,以“一句话搞定生产力”为核心,通过自然 语言对话,让用户无需专业背景或复杂操作,只需输入文字指令,即可快速完成 图片精修、品牌设计、电商物料制作、效果预览、视频生成及网站搭建等全场景 任务,应用上线首月 MAU 破百万。对于 AI 视频而言,与 AI Agent 的结合意味 着视频生成将像对话一样自然,使用门槛也将进一步降低。
文生视频工具功能逐步完善,催生多样化商业变现路径。随着技术迭代,AI 视 频生成已经不再局限于视觉。如谷歌的 Veo 3.1 模型已经支持 AI 生成音频,能 够根据画面中的物体运动、材质和叙事节奏,动态合成匹配的音效和背景音乐, 实现了真正的“音画同步”,让视频作品拥有灵魂。行业的竞争正从算法转向生态, 基于视频生成模型的商业化模式也正变得清晰。 个人+专业创作者+企业用户需求空间广阔。1)对于个人用户而言,AI 视频工具 有望重构视频互动方式,如 Sora2 结合社交互动,有望对标“AI 版 Tiktok”实现商 业化变现;2)对于专业创作者而言,稳定、高效的 AI 视频生成能力值得付费, 截至 2023 年 5 月,全球内容创作者数量超过 2.08 亿,各类设计师、短视频博主、 摄影师均可以利用 AI 视频工具提升工作效率;例如快手旗下的可灵 AI 超过 70% 的营业收入来自广告营销从业者和自媒体视频创作者等专业用户付费订阅会员, 这些专业用户是视频生成大模型的核心受众群体;3)对于企业用户而言,AI 视 频工具可广泛用于广告素材、影视内容的创作中,优化现有工作流。 多元化商业模式涌现,开辟全新创作者变现路径。除订阅制的商业模式路径,部 分产品也开始探索更多样化的商业模式。例如 MelodAI 平台,引入了 Web3 的 提示即收益机制,用户只需输入提示词生成音乐或视频,就能根据创作行为和内 容的影响力获得代币奖励。此外,以星界新智(StarSphere)为代表的平台,旨 在构建全球性的 AI 多模态资产交易市场,让创作者能够将 AI 生成的视频、图像 等作为可交易资产进行确权并上架交易,为创作者开辟全新的变现路径。
五、重点公司分析1、影视:文生视频颠覆传统影视内容生产,激活行业新动力
政策聚焦高质量供给,驱动影视内容多元发展。根据国家电影局统计数据,2018 年中国电影票房首次突破 609.76 亿元,2023 年随着线下活动恢复,电影票房达 到 549.15 亿元,同比增长 82.64%,且国产电影占比较高。2025 年截至 10 月 初,票房已超过 2024 年全年。在文化强国战略不断深入的背景下,“广电 21 条”等系列政策释放出了坚定支持影视行业高质量发展的积极信号,政策上呈现 对影视规范性、高质量内容输出、而非“数量取胜”的要求。随着居民消费能力 持续提升,对影视娱乐的需求有望催生更多影视产品的出现,影视产品的质量与 丰富度提升将成为核心发展方向,而创作分工也将更为明确和细化。对于以往因 成本或技术限制而难以触及的题材(如硬科幻、宏大历史场景),AI 视频生成技 术能大幅降低制作难度,使更多“小众”但高质量的想法得以实现。
文生视频降低行业门槛,加速各类创新内容形态产出迭代。文生视频对影视行业 的核心变革,在于形成“创意-落地-优化”的低成本、快速良性循环。基于目前 Sora 等 AIGC 工具的技术,AI 已经可以模拟生成大量不同角色和场景,在不涉 及高成本投入的情况下制作高质量影片,降低行业门槛,加速影视优质内容的产 出和迭代,在此前提下,以“AI 漫剧”为代表的创新内容形态应运而生,作为 AI 技术与动漫短剧深度融合的产物,AI 漫剧以漫画、小说等原作品 IP 为基础, 通过 AI 技术实现剧本生成、角色设计、分镜制作、视频合成及后期等全流程, 集均时长一般为 8-10 分钟,融合短视频的“短平快”特点,节奏紧凑且保留原 作剧情和艺术风格,相比真人短剧更具漫画风格和多元化特色,成为年轻用户群 体青睐的“电子榨菜”式创新内容形态。如腾讯动漫近期新上线的 AIGC 漫剧《我 的治愈系游戏》《传武》,全程由 7 人团队借助即梦 AI 完成,AI 承担分镜绘制、 场景渲染、动作串联等重复性工作,1 个月产出 20 集且上线四天播放量破千万,较传统动画团队效率提升数倍以上。从上游 IP、中游内容制作到下游分发变现, AI 漫剧有望带来新一轮产业趋势。
文生视频推动影视制作效果优化。在影视作品中期拍摄及后期制作过程中,文生 视频技术可以在场景、角色、特效等多方面提升画面制作效果。例如快速将文本 描述转化为动态场景,降低搭建成本,实现现实中无法复刻或成本极高的空间呈 现,赋予作品更强的视觉冲击力和艺术表现力。如《独行月球》借助 AI 输入指 令,还原月球低重力环境下尘埃的缓慢扩散、光线的特殊折射效果,并结合光流 估计技术确保背景与演员动作的光影同步,使场景更具真实感。
文生视频赋能影视制作降本提效。内容创作是影视制作行业的核心环节,而生成 式 AI 的应用能够用技术替代人力密集型工作,快速生成故事分镜视频,大幅节 约剧本撰写、原画设计、动画制作等准备周期,将所需时间从数月缩短到数天。 大大提升内容创作效率。2025 年暑期,改编自现象级网文 IP 的 30 集完整 AI 动 画《一品布衣》,借助 Vidu AI 融合大语言模型与扩散模型,实现了从文本拆解、 角色场景设计到视频制作的全流程落地,从开发到上线仅用 60 天,创下行业纪 录。其单集制作周期从传统 30 天压缩至 3 天,效率提升超 90%;人力成本从 30 人团队精简为 1 人,节省 96%;单分钟成本从 5 万元降至 3000 元,直接降本 93%。同时,该片在角色一致性、动作连贯性等技术难点上突破显著,不仅让 30 集内容保持统一的艺术风格与叙事水准,更确保制作质量未因提速而打折。
“用户即创作者”生态趋势涌现,注入影视行业全新活力。从内容创作的角度来 看,影视内容生产的个性化和多元化尤为重要。传统影视行业多为单向、标准化 创作,而文生视频模型能够根据用户具体需求构建差异化视觉内容,个人及专业 用户均可将其用于定制社交媒体内容,内容生命力和观众参与度进一步提升,形 成消费与生产互动共振的新生态。2024 年 3 月,OpenAI 计划携 Sora 与好莱坞 等影视公司合作,希望拓展 OpenAI 在娱乐行业的影响力与商业价值,将“互动 粉丝创作”视为影视公司的新兴盈利点;2025 年 9 月,YouTube 引入谷歌的升 级 AI 创作生成工具 Veo 3 Fast,鼓励用户对原有影视 IP 素材进行混剪、风格化 改编与多版本衍生创作。这种“用户即创作者”的互动生态,不仅提升了内容的 多元性和长尾价值,也增强了观众的情感黏性与社区互动参与感,有望为影视行 业注入全新活力。
2、游戏:文生视频赋能游戏制作及玩法创新,商业化空间 有望提升
游戏市场步入存量博弈,AI 创新玩法或成破局关键。根据 Newzoo 发布的《2025 年全球游戏市场报告》,2028 年全球游戏平台端收入预期将达到 2054 亿美元, 五年复合增长率 3.15%。国内方面,根据伽马数据,2024 年中国游戏市场实际 销售收入为 3257.83 亿元,同比增长 7.53%,自主研发游戏国内市场实销收入 2607.36 亿元,同比增长 1.7%。随着整体增速放缓,流量竞争趋向饱和,目前 游戏市场步入“存量博弈”模式,游戏企业从扩张型增长转向精细化运营与效率竞争,对成本端的管控以及创新玩法的开拓成为下一阶段占据市场份额的重要因 素。2024-2033 年全球生成式 AI 在游戏中的市场规模预计将从 14.3 亿美元增长 至 111.1 亿美元,CAGR 为 25.6%,随着生成式 AI 技术的迭代发展,AI 将成为 游戏研发中的重要一环。
Sora 加速游戏行业革新,有望重塑游戏创作流程。2023 年 5 月,英伟达推出游 戏定制化 AI 模型代工服务 Avatar Cloud Engine(ACE),开发人员能够利用 AI 视频生成工具 Audio to Face 进行栩栩如生的角色动画创作,开发者 Fallen Leaf 借此成功完成《索利斯堡》角色脸部动画。2024 年,Sora 的问世更是加快 了行业革新的速度。Sora 可以模拟人工开发过程,以视频游戏为例,通过向 Sora 提供包含“Minecraft”(《我的世界》游戏)一词的提示,即可以高保真的方式 渲染出与该游戏极其相似的游戏场景,同时还可以模拟玩家操作游戏角色。通过 生成式 AI 技术,开发者能够以更快的速度和更高的效率生成逼真的游戏场景、 动画和视觉效果,对物理特性、游戏玩法等内容的验证有巨大帮助,意味着小型 开发团队也能够在资源有限的情况下产出更多优质产品。 文生视频降低游戏制作门槛,提升创作效率。AIGC 贯穿了游戏行业的各个方面, 从内容生产到玩家体验实现多维度赋能,如 2D/3D 美术资源生成、代码编写、 剧情与 NPC 行为逻辑生成、自动化效率测试等,AIGC 技术的投入能够一定程 度节约成本,提升产出效率。如影眸科技的 ChatAvatar 平台支持通过对话或图 片等方式一键生成 3D 角色资源,还支持导入到 Unity、虚幻引擎、Maya 等中使 用,小团队甚至是视频创作者个体都可以使用,大大降低了游戏角色建模的技术门槛,简化游戏创作流程从而提高创作效率。Unity 发布的《2025 年 Unity 游戏 报告》显示,2024 年接受调研的工作室中,有 96%的游戏工作室在工作流程中 使用了 AI,而这一数据在 2023 年仅为 62%。
文生视频赋能玩法创新,AI 激发个性化活力。以 Sora 为例,其在生成视频时长、 内容逻辑一致性、视频分镜等方面形成突破,一方面技术革新了内容创作流程, 降低了游戏制作的门槛,另一方面,类似 Sora 的文生视频模型在上线后的玩法 迭代、用户体验优化等方面同样具备深刻意义。2025 年 9 月,AI 3D 生成公司 VAST 与网易《蛋仔派对》达成合作,将 Tripo AI 3D 大模型技术引入游戏的 UGC 创作系统。玩家可通过文字或图片生成 3D 模型,并直接用于地图创作,极大提 高了 UGC 内容的多样性和游戏的可玩性。
3、IP:文生视频加速 IP 可视化,有望重塑行业价值
Z 世代消费理念崛起,“情绪价值”为先壮大 IP 消费基础。根据国家统计局数 据,目前Z世代占国内总人口的比重不到20%,但所贡献的消费规模已占到40%。 到 2035 年,73%的 Z 世代人口将会成为职场新人,Z 世代整体消费规模有望增 长 4 倍至 16 万亿元,是未来消费市场增长的核心要素。Z 世代消费者更多聚焦 自尊和情绪价值的需求,对于个性化消费和社交化消费更为关注,年轻群体深受 热剧综、游戏、卡通动漫等影响,能够与相关 IP 衍生产品建立情感共鸣,激发 购买意愿,从而助推二次元、盲盒、玩具游艺、IP 礼品纪念品等新消费方式火爆 出圈。根据阿里鱼消费品与营销项目授权报告,消费者购买过的 IP 类型 TOP3 依次是影视综艺、电子游戏、卡通动漫,分别占比 48.8%、47.4%、44.8%,均 为与“谷子经济”高度关联的消费赛道。有超七成用户表示在挑选商品时会考虑 商品里的 IP 元素。随着 IP 产业不断与其他产业融合,游戏与影视、动漫、文学 等领域的联动将更加频繁,通过推出衍生作品或改编作品,形成新的商业模式和 盈利点。 AI 助力内容制作提效,加速 IP 孵化及优质作品产出。传统动画制作流程繁琐, 依赖大量人工绘制和调整,成本高昂且周期漫长,对大量优质 IP 的变现形成桎 梏,而现有视频大模型可将 IP 改编的制作周期从数月甚至数年缩短至几周甚至 几天,“IP+AI”有望带来极低或零边际成本的内容生产。以动画电影《哪吒之 魔童闹海》为例,其借助 AI 辅助角色设计、场景渲染及特效生成,其中的“裂 空爪”八层岩浆流体特效,借助 AI 通过智能拆解任务系统,同步处理流体力学 模拟、材质渲染与动态合成,将原本需要百人团队协作的复杂工程转化为精准的 算法指令,大大节省了投入成本。
AI 助力 IP 内容改编打造互动生态,拓宽多元创意边界。在内容创作领域,AI 文 生视频技术打破了 IP 内容只能由官方生产的传统模式,让粉丝能够成为内容的 共同创作者,不仅能拓展丰富创意边界,更能形成极强的社群归属感和参与感。 2025 年 5 月,由 Vidu 发起的动画西游改编大赛掀起了 AI 驱动的全民二次创作 浪潮,让粉丝从“观众”变为“共创者”。利用 Vidu 等全球领先的 AI 视频内容 生产平台,构建新的互动场,生成的 AI 视频在社交平台自主裂变传播,反哺 IP 生态,形成“用户参与-内容裂变-IP 增值”的正向循环,进一步提升 IP 的情感 附加值,扩大 IP 生态商业化价值。
AI 赋能 IP 衍生品开发效率提升,有望最大化商业化价值。随着以 Z 世代为主导 的情感消费崛起,IP 衍生品正从“商品”逐步升级为“社交货币”。据 QuestMobile 统计数据,2024 年我国谷子经济市场规模已达 1798.8 亿元,预计 2027 年将突 破 3000 亿元关口,2024 年淘宝平台 IP 衍生周边成交额已超百亿元人民币,包 含毛绒玩具、吧唧等,还有爆款谷子单品链接成交额突破 4000 万元。IP 经济的 核心在于 IP 价值的多维度释放,而 AIGC 恰好为此流程提供了技术支点,不仅 能根据用户偏好助力开发各类 IP 衍生品,如玩具、盲盒、数字藏品等,为创意 生成效率提升助力,还能助力 IP 跨平台推广,通过短视频、互动推文等形式扩 大 IP 影响力。目前,类似 Sora、Google Nano Banana 等多模态产品技术已经 支持快速生成角色多角度 3D 模型,未来可用于手办、潮玩等设计流程,减少传统生产流程中建模耗时,为各类 IP 衍生品提供源源不断的供给支撑。
AI 推动 IP 长尾价值释放,长线运营有望迎来新范式。对于优质 IP 而言,其商业 化价值释放中一个核心痛点在于,主产品(如电影、电视剧)上线后,IP 热度会 随时间推移自然衰减,如何在成本可控的情况下维持IP热度成为又一重要命题。 对于传统运营流程而言,为维持热度而持续的进行内容投入意味着成本投入。AI 时代下,AI 图像及视频生成技术使得“长尾内容”的规模化与个性化生产成为可 能。例如 Sora 等 AI 工具可以通过故事续写、支线剧情、小剧场、风格混剪等方 式,将核心 IP 快速转化为海量的衍生短视频内容,填充到社交媒体矩阵中,在 此过程中,AI 还能学习并迁移原 IP 的视觉风格,在衍生过程中实现风格的融合 与创新,为粉丝提供近乎无限的“精神食粮”,将短暂的“爆款”转化为长期的 “文化符号”,为其商业化价值的最大化提供助力。
4、相关标的
(1)腾讯控股
腾讯混元大模型自 2023 年首批通过备案后,至 2025 年持续迭代升级并实现规 模化商业化落地。模型家族不断扩容,至今已接入语言模型(如Hunyuan-TurboS、 Hunyuan-MT-7B 等)、语音模型、视觉理解模型(如 Hunyuan-MT-7B)、视觉 生成模型(如 HunyuanImage 3.0、文生图-all、文生视频-fast 等),集成文本生 成、图像创作、视频生成及 3D 模型生成等多模态能力,其中翻译模型Hunyuan-MT-7B 于 25 年 9 月登顶 HuggingFace 全球热榜,支持 33 个语种互 译;HunyuanImage 3.0(混元图像 3.0)是全球首个统一图像理解与生成的原生 多模态开源模型,基于 800 亿参数架构,在推理时激活 130 亿参数,具备思维 链推理能力,在文本-图像对齐和视觉质量评估中达到业界领先水平,成为目前 最强大的开源图像生成模型,发布后在人工评测 GSB(Good/Same/Bad)评估 体系中展现出显著的性能优势,表明 HunyuanImage 3.0 作为开源模型,在综合 性能上已达到业界领先闭源模型的同等水平,是目前表现最优的开源解决方案。 此外,混元 3D 世界模型 1.0 开源可分钟级生成可编辑虚拟世界。目前大模型已 全面融入腾讯各业务线,包括 C 端腾讯元宝入驻微信联系人列表,支持文件解析 与代码生成;B 端通过腾讯云对外输出能力,赋能游戏、腾讯会议、广告、客服 等场景,成为四大核心业务增量引擎。
(2)快手
公司围绕商业要素构建垂直领域模型集群,核心模型包括快意大模型(侧重语言 处理)、可图(图像生成)、可灵 AI 视频大模型(支持文生视频、图生视频及 视频编辑);在视频生成领域,可灵 AI 表现尤为突出,2025 年 9 月已迭代至 2.5 Turbo 版本,文本理解能力、视频动态质量进一步增强,能更好地学习和模 拟真实世界的物理动态。可灵 AI 目前已在全球拥有超过 4500 万创作者,累计生 成超 2 亿个视频和 4 亿张图片,服务超过 2 万家企业客户,25 年 Q2 单季可灵 AI 营收达 2.5 亿元,其应用场景的深度探索也带来了商业化的快速增长。影视领 域,2025 年 6 月与星芒短剧、异类 Outliers 联合出品了全球首部 AI 单元故事集 《新世界加载中》,迄今全球累计播放量近 2 亿,并获得首届中国微短剧盛典“年 度 AI 短剧”荣誉;游戏领域与《逆水寒》合作生成角色及特效,支持玩家将静 态图片到动态视频的高效转化。
(3)哔哩哔哩
公司围绕其“内容生态+创作者社区”的核心优势布局 AI 应用,包括开源多个关 键基础模型,其中开源动漫视频生成模型 AniSora 在 2025 年 7 月已迭代至 V3 版本,支持番剧片段、VTuber 内容、鬼畜视频等多类二次元场景一键生成。今 年世界人工智能大会上,B 站公布了其为服务海外用户而全新自研的「AI 原声翻 译功能」,以便海外用户更好体验游戏、科技、二次元等主推内容,功能除了自 动擦除中文字幕改为英文、弹幕翻译及各类按钮英文适配等基础的文本互译之外, 还能完美还原 UP 主的声线、音色、气口,而非传统的机器音翻译,同时还能基 于翻译语言进行口型模拟。创作者支持方面,2025 年 7 月 7 日,公司宣布推出 内部代号为“代号 H”的、专为视频播客创作者设计的 AI 创作工具,支持文案 与音频输入生成视频,具备高效生成能力——千字内容可在 6 分钟内完成视频制 作,未来有望进一步压缩至 3 分钟。
(4)美图公司
公司以“AI 美学+垂直场景深耕”为核心战略,依托长期的影像技术积累与美图 影像研究院研发实力,构建起以自研 AI 视觉大模型 MiracleVision 为核心的技术 体系。AI 视频方面,模型满足文生视频、图生视频、视频运镜、视频生视频四大功能,支持多图参考、首尾帧控制等快捷操作。搭载精密计算运动模块,保证动 作连贯性,并引入画质增强的后处理模块,更精准理解语义,生成流畅视频内容, 目前 MiracleVision 的 AI 视频能力已能融入行业工作流。2025 年 7 月 15 日,美 图 AI AGENT 产品 RoboNeo 正式上线,作为专注于影像与设计的 AI 智能体, 其核心亮点是以自然语言交互赋能视觉创作,极大降低专业创作门槛。功能上, RoboNeo 可完成 AI 智能修图、视频处理生成、AI 设计生成等多种视觉创作任 务,支持多模态创作,功能覆盖范围广泛,是公司完善 AI 应用生态的重要一环。
(5)昆仑万维
公司坚持“All in AGI 及 AIGC”战略方向,以自主可控的算力集群为支撑,保持 产品高频迭代,构建起从基础模型到场景应用的全产业链布局。25 年 8 月,公 司连续发布六款大模型,从 SkyReels-A3 音频驱动人像视频生成模型,到 Matrix-Game 2.0 世界模型升级版、Matrix-3D 场景生成大模型,再到 Skywork UniPic 2.0、Skywork Deep Research Agent v2 和 Mureka V7.5 中文音乐生成模 型,覆盖视频、3D、图像、智能体和音乐等多模态核心赛道。公司旗下短剧平 台 DramaWave 截止 25Q2 年化流水收入(ARR)突破 2.4 亿美金,月活超 1000 万,累计下载量突破 3000 万,跻身全球短剧应用前五,在营销素材、广告投放 等方面深度应用 AI 提升效率;公司旗下 Skyreels 是全球首款 AI 短剧平台,集成 了剧本、分镜、3D 生成等大模型,提供从文本到视频的一体化创作流程,支持 高精度角色控制和音乐视频制作,支持创作者“一键成剧”。
(6)阅文集团
公司坚持“以 IP 为核心、精品化为路径”的策略,夯实竞争优势。公司已汇聚 超 1390 万部作品储备、超 950 万名创作者,覆盖 200 多种内容品类并深耕科幻、 历史、非遗等垂类,触达全球众多用户,IP 生态持续扩容。2025 上半年长剧霸 屏榜 Top10 中 60%改编自阅文 IP;动漫端《斗破苍穹》年番登顶腾讯视频付费 榜,《道诡异仙》漫画刷新新作攀升纪录,30 部漫剧播放量破千万,同时开放 十万部精品 IP 用于漫剧开发,推出 AIGC 工具“漫剧助手”提升改编效率;2025 年 3 月宣布开放 2000 余部网文 IP 用于打造优质短剧。近年来,公司积极拥抱 AIGC 技术浪潮,将人工智能深度应用于创作辅助、内容翻译、IP 衍生开发等环 节,显著提升了 IP 运营效率与跨媒介叙事的创新能力。在“AI+IP”战略的驱动 下,阅文正推动其丰富的 IP 资源库向互动短剧、沉浸式体验等新业态加速延伸, 持续引领网络文学产业的升级与变革。
(7)芒果超媒
公司持续推进其“应用驱动”的 AI 战略,通过自研核心技术平台深度赋能内容 生态。公司已组建 AIGC 创新应用团队,成功研发并落地了 AIGC 视频自动拆条 技术,广泛应用于《全员加速中 2023》《我的人间烟火》等重点影视综艺的短 视频化处理,极大提升了内容二次分发的效率。同时,公司自研的 AIGC HUB 平台整合了文本、图像、语音等多模态生成能力,为内容创作、广告营销等场景 提供一站式 AI 工具支持,助力降本增效。公司也在 AI 角色互动等方面探索创新,如国内首个 AI 导演“爱芒”在芒果 TV 综艺《我们仨》中以助理导演的身份与嘉 宾共同参与节目。此外在商业化探索上,公司依托“山海 AIGC 创作平台”将版 权资源转化为数字资产、孵化《坐标》等纯 AI 微短剧,将传统流程进化为 AI 工 作流。2025 年 10 月,芒果 TV 面向全行业启动“AIGC 微短剧创作者生态计划”, 将提供百部微短剧、漫剧版权 IP、AI 工具及资金流量扶持,推动 AIGC 微短剧、 漫剧赛道高质量发展。
(8)华策影视
公司 AIGC 应用聚焦“影视+AI”专业影视工作流研究,已拥有两款通过国家备 案的影视垂类大模型:2024 年 5 月,“有风”大模型通过备案,支持文生文、 百万级别小说阅读理解和评估、特有短剧情节桥段库等功能,可实现“3 分钟完 成 IP 初筛、30 分钟评估百万字作品”,与人工评估匹配率达 60%-70%,计划 提升至 80%-90%。基于该大模型衍生出的 AI 小说筛选、内容评估等工具已广泛 应用于公司电视剧、电影、短剧等团队制作;2025 年 1 月,“国色”大模型通 过备案,具备文生图、文生视频、多语种翻译等多模态能力,支持西班牙语、阿 拉伯语、法语等十多种语言的内容提取、翻译与生成,使海外内容制作效率提升 30%。2024 年 7 月,华策影视旗下华策投资斥资 1 亿元参与设立“盐城智华” 基金,直接投资智谱 AI,同年 11 月,双方正式签署战略合作协议,合作方向聚 焦文生视频、AI 智能体、内容审查模型三大板块。
(9)欢瑞世纪
公司将资源重点聚焦于短剧、互动影游、AI 短剧与 AI 漫剧等创新业务领域,力 图在传统影视剧的基础上打造更多元、更具韧性的业务生态。公司旗下互动影游 项目《江山北望》预计于今年四季度上线,未来还将陆续推出《千香》《佳偶天 成》《十年一品温如言》等剧集。短剧业务方面,公司已在抖音、快手、微信视 频号等平台搭建矩阵账号,累计播放量突破 30 亿次,多部短剧播放量过亿。海 外短剧平台也已上线,开启出海探索。2025 年 2 月,公司与阶跃星辰的战略合 作落地,双方联合创立“麟跃”AI 实验室,2025 年 7 月推出首部 AI 作品《十州 三境》。公司表示,将持续向精品化方向发展,结合 AI 技术和原创 IP 储备打造 差异化优势。
(10)上海电影
公司 IP 储备丰富,围绕“精品内容、大 IP 开发、数字化转型”战略规划,以影 院运营及电影宣发为“第一赛道”,逐步开启大 IP 开发“第二赛道”,聚焦 IP+AIGC 新业态。2023 年 5 月收购上影元后,公司布局大 IP 开发业务,拥有 60 多个经 典 IP 资源,稳居产业上游。影视 IP 方面,《浪浪山小妖怪》(原《小妖怪的夏 天》)大电影已于 2025 年 8 月上映,并储备《中国奇谭》第二季等项目; 2023 年,上影 IP 授权商品 GMV 超 10 亿元,计划三年后实现 IP 合作产品涉足 5 大 领域、30 个行业、500 个以上品牌,落地全国 30 个省份,合作商品 GMV 超百 亿元。2024 年 2 月,公司上海电影节发布 iNEW 战略,启动“iPAi 星球计划”, 通过 AI 技术加速 IP 内容焕新与商业开发,推动网络数智化、一体化扩张及全球 化生态布局。
(11)光线传媒
公司动画电影项目储备丰富。涵盖了部分热门 IP 续集,如《哪吒之魔童闹海》 《姜子牙 2》《大鱼海棠 2》《西游记之大圣闹天宫》等;以及中国神话宇宙系 列动画电影,如《朔风》《八仙过大海》《相思》《小倩》《凤凰》《红孩儿》 《二郎神》《去你的岛》等。公司 IP 运营业务初显成效,围绕“哪吒”IP 开发 的衍生品已覆盖 30 个品类、500 多个产品。公司已筹备线上电商渠道,并计划 开设快闪店及线下品牌旗舰店,AIGC 在 IP 孵化、多形态内容衍生(如游戏、卡 牌、主题乐园等)上提供强大助力。公司通过参股公司七维科技与英伟达建立了 双重深度战略合作关系,斥资 5.8 亿搭建 GPU 算力集群,共同开发生成式 AI 工 具集 AI Studio,涵盖文字生成、语音生成、图像生成、视频生成、三维模型生 成等功能,预计将大幅提升创作效率,降低生产成本。
(12)中文在线
公司以优质网文为核心,通过音频、动漫、中短剧、影视、游戏等产业联动,开 展 IP 全生命周期培育与衍生开发,布局 AIGC 多模态能力赋能 IP 孵化链条,推 动文字 IP 向全生命周期生产经营进化。公司旗下拥有 17K 小说网、四月天小说 网、海狸故事等知名原创平台,海量 IP 资源成为公司强力竞争优势。2025 年 7 月《罗小黑战记 2》上映 24 天票房破 4 亿,观影超 1200 万人次,优质 IP 价值 持续释放。公司自研“中文逍遥”大模型迭代至 2.0 版本,广泛应用于剧本辅助 生成、角色设定等环节,显著提升 IP 转化效率。短剧领域,国内运营“野象剧 场”,海外平台 ReelShort 借助 Sora 等文生视频技术降本提速;动漫领域,2024 年 AI 动漫短剧播放量破 30 亿次,实现 AIGC 内容创新的工业化落地。2025 年 首部 AI 3D 动漫《仙尊归来:只手镇人间》登顶抖音动态漫热榜,10 月 13 日累 计播放破 4700 万、单日消耗超百万。
(13)网易
公司坚持 AI 创新技术自研,并持续深化 AI 技术在全业务线的融合与应用。游戏 方面,《逆水寒》依托底层伏羲 AI 大模型“AI 江湖”系统,实现 NPC 对自然语 言指令的理解、响应与互动记忆,提升玩家沉浸感。模型支撑“剧组模式”产出 千万级 UGC 动画,传播破百亿,更新版本新增 AI 宠物表情包生成、多人短剧创 作等功能;《蛋仔派对》持续升级 AI 算法 UGC 创作工具,降低创作门槛。AI 深度融入游戏制作全流程,网易雷火构建 1000+条生产管线,场景设计效率提升 70%,动画生产提效 30%,部分场景达 300%。游戏技术迁移至矿山行业,实现 单机效率达人工 80%、成本降低 30%。推出多模态数学解题助手与作文智能批 改系统,已在部分中小学开展试点合作;公司在 AIGC 等创新技术投入方面保持 积极态度,后续随着应用逐步落地,有望为商业化打开更多预期空间。
(14)巨人网络
公司于 2022 年底成立 AI 实验室,于 2023 年发展出了基于游戏核心要素的“游 戏+AI”增效平台,支持游戏的开发、运营和发行,覆盖图像、视频、音频、代 码、文本、模型和策略等多个领域。2025 年“游戏+AI”布局持续深化,技术落 地与玩法创新双线突破,旗下 AI 大模型 GiantGPT 垂类大模型专注于游戏业务, 建立 AIGC 生产能力,实现“iMagine-AI 绘画云平台”“CodeBrain-代码生成助手”“百灵-AI 语音生成”等平台化基础技术能力构建,并针对角色演绎、情景 推理与长期记忆等基础能力进行深度优化。公司在其手游《太空杀》中引入由 GiantGPT 驱动的“AI 推理小剧场”“AI 残局挑战”玩法,并联合阿里通义千问、 腾讯混元、字节豆包三大国产大模型,打造游戏行业首个“多用户与 AI 智能体 混合对抗”的创新竞技机制。同时还有“侦探剧场”“内鬼挑战”等多个 AI 原 生玩法,此外《原始征途》全面接入 DeepSeek-R1,核心 AI NPC“小师妹”完 成智能化升级,实现更自然的交互响应。
(15)恺英网络
公司通过“AI+IP”双轮驱动战略,聚焦人工智能与传统文化两大核心赛道,搭 建一个不止于游戏、硬件、应用、潮玩与数字文化的新型技术与内容生态。公司 核心自研“形意”大模型已升级为涵盖界面生成、地图生成、动画生成、代码生 成和数值生成的完整工具链,AI 深度赋能各个环节,整合实现高效协同。如“爱 动”动画生成器通过简化流程,几分钟即可完成角色动画制作流程,“仙术”地 图生成器通过 AI 技术实现周级缩短到天级。公司 2025 年 6 月发布的《SOON》 AI 全流程开发平台进一步整合多模态能力,实现从美术资产生成到代码部署的端 到端交付,将游戏开发周期从数月压缩至小时级。AI 应用方面,通过投资企业自 然选择开发全球首款 3D EVE AI 智能陪伴应用,依托自研 Vibe、Echo 大模型实 现电影级虚拟陪伴。公司通过技术工具链、硬件终端与 IP 内容的闭环整合,旨 在降低创作门槛,构建“AI 驱动数字生活”的生态体系。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
来源:未来智库