新之航传媒申请基于语音识别的数字人驱动方法专利,提高数字人与观众的交互灵活性

B站影视 2024-12-02 13:31 1

摘要:国家知识产权局信息显示,新之航传媒科技集团有限公司申请一项名为“基于语音识别的数字人驱动方法、设备及系统”的专利,公开号CN 119049476 A,申请日期为2024年10月。

金融界2024年12月2日消息,国家知识产权局信息显示,新之航传媒科技集团有限公司申请一项名为“基于语音识别的数字人驱动方法、设备及系统”的专利,公开号CN 119049476 A,申请日期为2024年10月。

专利摘要显示,本发明涉及语音识别技术领域,具体涉及一种基于语音识别的数字人驱动方法、设备及系统,该方法包括:获取目标区域的各声源的音频数据;确定属于交互用户的语音的目标独立成分语音;确定相似语音组;根据第一目标独立成分语音的第一采集时刻、第二目标独立成分语音的第二采集时刻以及声音传播速度,确定交互用户到第一位置的第一参考位置以及交互用户到第二位置的第二参考位置之间的距离差;根据第一参考位置与第二参考位置之间的距离以及距离差确定交互用户的目标位置;利用交互用户在目标区域内的目标位置驱动数字人面向交互用户。如此,本发明提高了数字人与观众的交互灵活性,保证了观众在交互的过程中的参与感,提高了观众的互动体验感。

来源:金融界

相关推荐