中国电信申请一种文本识别专利,解决存在较多漏判、误判现象准确率低的问题

B站影视 日本电影 2025-04-07 11:12 3

摘要:国家知识产权局信息显示,中国电信股份有限公司申请一项名为“一种文本识别方法、装置、电子设备及存储介质”的专利,公开号 CN 119760141 A,申请日期为2024年11月。

金融界2025年4月7日消息,国家知识产权局信息显示,中国电信股份有限公司申请一项名为“一种文本识别方法、装置、电子设备及存储介质”的专利,公开号 CN 119760141 A,申请日期为2024年11月。

专利摘要显示,本申请实施例提供了一种文本识别方法、装置、电子设备及存储介质,包括:对待识别文本的分词数据进行哈希运算,得到所述分词数据对应的第一哈希值;判断所述第一哈希值与数据库中存储的第二哈希值是否匹配成功;若所述第一哈希值与所述第二哈希值匹配失败,则使用词嵌入模型和注意力机制对所述分词数据进行处理,得到所述分词数据对应的敏感相似度;根据所述敏感相似度确定所述分词数据是否为敏感数据;若所述分词数据为敏感数据,则使用蒸馏模型和条件随机场模型对所述敏感数据进行分类,获得所述敏感数据的分类结果,以解决目前无法识别出潜在的敏感信息,从而存在较多漏判、误判现象、准确率较低的问题。

天眼查资料显示,中国电信股份有限公司,成立于2002年,位于北京市,是一家以从事电信、广播电视和卫星传输服务为主的企业。企业注册资本9150713.8699万人民币,实缴资本5737705.3317万人民币。通过天眼查大数据分析,中国电信股份有限公司共对外投资了87家企业,参与招投标项目5000次,财产线索方面有商标信息54条,专利信息5000条,此外企业还拥有行政许可71个。

来源:金融界

相关推荐