摘要:国家知识产权局信息显示,深圳行星网络科技有限公司申请一项名为“基于人工智能的敏感词精确过滤方法”的专利,公开号CN 119106131 A,申请日期为2024年8月。
金融界2024年12月12日消息,国家知识产权局信息显示,深圳行星网络科技有限公司申请一项名为“基于人工智能的敏感词精确过滤方法”的专利,公开号CN 119106131 A,申请日期为2024年8月。
专利摘要显示,本发明涉及文本处理技术领域,具体涉及基于人工智能的敏感词精确过滤方法,该方法包括:采集待过滤目标文本句子;使用正则表达式和中文分词工具获取各目标文本句子的词汇序列,并获取所有目标文本句子的疑似敏感词集合,进而获取各目标文本句子的书写合理性;根据BERT模型获取各目标文本句子的情感分数;根据FastText模型获取疑似敏感词和敏感词词典中词汇之间的语义相关性,并获取目标文本句子中各敏感词的语义脱敏度,进而获取各目标文本句子的语义脱敏度;计算各目标文本句子的潜在敏感指数,进而对目标文本句子进行过滤。本发明旨在解决由于考虑目标文本句子的特征太少从而导致过滤结果较差的问题。
来源:金融界
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!