摘要:国家知识产权局信息显示,广州钛动科技股份有限公司申请一项名为“一种数字人的口播视频生成方法、系统、设备及介质”的专利,公开号CN120475233A,申请日期为2025年06月。
金融界2025年8月13日消息,国家知识产权局信息显示,广州钛动科技股份有限公司申请一项名为“一种数字人的口播视频生成方法、系统、设备及介质”的专利,公开号CN120475233A,申请日期为2025年06月。
专利摘要显示,本申请公开了一种数字人的口播视频生成方法、系统、设备及介质,方法通过获取口播文案和视频素材数据,利用多模态大模型分析确定文案在视频素材中的时间戳;将文案转为音频数据并预处理后,结合时间戳与视频合并生成第一视频数据;根据用户需求生成数字人,经抠像处理后与第一视频合并得到口播视频。本申请突破传统模板化生成模式,通过多模态语义匹配和个性化数字人生成技术,实现数字人口播视频的定制化生产;同时采用音视频精准同步、高质量抠像及合成技术,保障内容适配性与视频质量,显著提升数字人口播视频生产的灵活性、效率和效果。
天眼查资料显示,广州钛动科技股份有限公司,成立于2017年,位于广州市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本6000万人民币。通过天眼查大数据分析,广州钛动科技股份有限公司共对外投资了12家企业,参与招投标项目5次,财产线索方面有商标信息146条,专利信息73条,此外企业还拥有行政许可27个。
本文源自金融界
来源:金融界一点号