摘要:金融界 2025 年 3 月 22 日消息,国家知识产权局信息显示,吉林省吉林祥云信息技术有限公司申请一项名为“基于 SadTalker 的实时虚拟数字人播报方法”的专利,公开号 CN 119653171 A,申请日期为 2024 年 11 月。
金融界 2025 年 3 月 22 日消息,国家知识产权局信息显示,吉林省吉林祥云信息技术有限公司申请一项名为“基于 SadTalker 的实时虚拟数字人播报方法”的专利,公开号 CN 119653171 A,申请日期为 2024 年 11 月。
专利摘要显示,本发明之基于 SadTalker 的实时虚拟数字人播报方法,属于计算机视觉和人工智能技术领域中的视频生成,为了提高虚拟数字人的实时性和自然逼真度,本发明包括步骤 1、原始图片生成无语音视频帧;步骤 2、将视频帧图片按照人脸检测算法的结果裁剪出人脸图片,并保存作为 SadTalker 模型的输入;步骤 3、持续读取语音流并进行预处理;步骤 4、将人脸图片和实时语音流经数据调度后传入 SadTalker 模型,增加实时短帧推理适配性修改,限制模型使用短语音推理;步骤 5、人脸位置还原,并形成完整视频帧;步骤 6、视频帧和语音流时间戳匹配;通过 REF 视频的加入,使虚拟数字人更加自然逼真,采用短帧推理技术,使虚拟数字人的视频生成过程更加高效,从而显著提高了实时性。
天眼查资料显示,吉林省吉林祥云信息技术有限公司,成立于2018年,位于长春市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本80000万人民币,实缴资本15600万人民币。通过天眼查大数据分析,吉林省吉林祥云信息技术有限公司共对外投资了4家企业,参与招投标项目914次,财产线索方面有商标信息12条,专利信息30条,此外企业还拥有行政许可5个。
来源:金融界