虎牙申请训练样本选取相关专利,提高模型训练效果和模仿能力

B站影视 内地电影 2025-08-05 15:10 1

摘要:国家知识产权局信息显示,广州虎牙信息科技有限公司申请一项名为“训练样本选取方法、装置、电子设备及存储介质”的专利,公开号CN120409489A,申请日期为2025年04月。

金融界2025年8月5日消息,国家知识产权局信息显示,广州虎牙信息科技有限公司申请一项名为“训练样本选取方法、装置、电子设备及存储介质”的专利,公开号CN120409489A,申请日期为2025年04月。

专利摘要显示,本发明涉及计算机技术领域,提供一种训练样本选取方法、装置、电子设备及存储介质。该方法包括:首先将主播的直播语音转换为直播文本,并滤除直播文本中的干扰信息得到目标文本;然后确定目标文本中每个句子的语义特征和风格特征,并将每个句子的语义特征和风格特征存储至主播的主播语料库;最后按照预设的分层聚类策略,基于主播语料库中每个句子的语义特征和风格特征进行聚类,获得多个目标句子,并将每个目标句子均作为主播对应的角色扮演模型的训练样本;其中,角色扮演模型用于模仿主播的语言风格。通过选取能够准确表示主播语言风格的文本以训练角色扮演模型,从而提高了模型的训练效果和模仿能力。

天眼查资料显示,广州虎牙信息科技有限公司,成立于2016年,位于广州市,是一家以从事互联网和相关服务为主的企业。企业注册资本92293万人民币。通过天眼查大数据分析,广州虎牙信息科技有限公司共对外投资了21家企业,参与招投标项目7次,财产线索方面有商标信息905条,专利信息546条,此外企业还拥有行政许可30个。

来源:金融界

相关推荐