摘要:国家知识产权局信息显示,上海慧洲信息技术有限公司申请一项名为“一种基于MACBERT和GECTOR的改进式中文文本纠错方法”的专利,公开号CN120046601A,申请日期为2025年01月。
金融界2025年5月27日消息,国家知识产权局信息显示,上海慧洲信息技术有限公司申请一项名为“一种基于MACBERT和GECTOR的改进式中文文本纠错方法”的专利,公开号CN120046601A,申请日期为2025年01月。
专利摘要显示,本发明公开了一种基于MACBERT和GECTOR的改进式中文文本纠错方法,包括步骤:对输入文本进行分别通过改进式macbert模型进行拼写错误识别和通过gector模型进行语法错误识别;冲突处理;对模型识别结果进行后处理;其他类型错误检测,包括成俗俗语检测,敏感词检测,时间格式,重要人物姓名,排序,实体搭配附属关系,段落或者字词重复错误类型的检测;将上述结果进行融合;基于领域内规则后处理减少误报,最终输出错误检测报告。本发明的纠错模型架构使用macbert模型解码机制来识别拼写错误,并通过后处理手段来过滤一些新词、特殊用法最终输出纠错结果,准确率高。
天眼查资料显示,上海慧洲信息技术有限公司,成立于2014年,位于上海市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2000万人民币。通过天眼查大数据分析,上海慧洲信息技术有限公司共对外投资了1家企业,参与招投标项目132次,专利信息4条,此外企业还拥有行政许可1个。
来源:金融界