摘要:2022年3月,最高人民法院明确部署智慧法院建设重点任务,要求聚焦全链条要素式审判技术攻关,构建全国共享的要素式审判知识库与系统能力,同步推进司法数据中台和智慧法院大脑建设。政策明确以离婚纠纷、物业服务合同纠纷等六类法律关系明晰、案件体量大、文书生成规则标准化
一、技术背景
2022年3月,最高人民法院明确部署智慧法院建设重点任务,要求聚焦全链条要素式审判技术攻关,构建全国共享的要素式审判知识库与系统能力,同步推进司法数据中台和智慧法院大脑建设。政策明确以离婚纠纷、物业服务合同纠纷等六类法律关系明晰、案件体量大、文书生成规则标准化的案由为突破口,实现裁判文书内容100%高准确率全自动生成目标。
经过多年信息化深耕,法院审判业务系统已形成成熟生态,尤其是智能化审判服务系统,通过卷宗智能查阅、庭审辅助、文书自动生成等功能,构建起覆盖办案全流程的智能支持体系,为要素式审判落地奠定技术基础。
在此技术底座上,明朝万达研发的案件信息深度应用服务平台实现关键突破:通过OCR识别、NLP语义分析等技术,从全量多媒体电子卷宗中精准提取案件基本信息、案情要素、审判流程信息等核心数据,并构建关联知识图谱,与法院现有审判系统实现无缝数据互通与能力融合,推动审判信息化向“全要素智能解析-识图谱构建-系统能力赋能”的深度智能化升级。
二、服务平台设计方案
▲ 图1 案件信息深度应用服务平台架构图
如图1所示,案件信息深度应用服务平台依托文本、图片、视频、音频等电子卷宗数据,实现真实场景中案件信息智能关联技术的深度应用,核心体现在:
第一,融合数据驱动的深度学习目标检测算法与知识驱动的跨媒体知识图谱技术,实现多媒体电子卷宗的结构化处理与知识抽取;
第二,构建跨媒体知识图谱的结构化表达与动态构建体系,形成包含本体库、概念库、事实库、规则库的大规模跨媒体知识谱系;
第三,研发案件深度语义计算技术,通过知识泛化、激活及推理实现高级别语义感知与案件信息智能关联,提供智能决策支持。
1.知识信息抽取技术
作为自然语言处理(NLP)核心技术,知识信息抽取通过结构化处理实现非结构化文本的知识转化,核心技术路径包括:
· 实体识别:运用命名实体识别(NER)技术精准定位文本中的关键实体,涵盖当事人信息等司法领域核心要素;
· 关系抽取:基于语义解析或深度学习模型,挖掘实体间法律关联关系,如“原告-起诉-被告-约定条款”等权利义务关系;
· 事件抽取:通过语义角色标注与规则引擎,识别法律事件触发词及构成要素,构建“主体-行为-客体-结果”的事件结构化模型。
2.跨媒体关联技术
通过多模态数据向量化表征与深度语义关联分析,实现文本、图像、音视频等跨媒体数据的统一语义建模,核心技术路径如下:
· 多模态向量化表征:运用跨媒体协同注意力机制的门控循环单元(GRU)网络,将文本TF-IDF特征、图像CNN特征、音频MFCC特征映射至1024维统一语义向量空间,构建多模态数据的结构化数字表征;
· 深度关联分析:融合跨媒体数据的语义特征(法律关系逻辑)与分布特征(数据时空规律),通过三重对齐损失函数(语义对齐+分布对齐+结构对齐)优化跨模态特征一致性,实现证词与书面证据的关联验证映射等;
· 一致性表示学习:构建跨媒体统一特征向量空间,在保持语义分析准确率的同时,使模型训练收敛速度较传统方法提升,支撑了电子卷宗中多形态证据链的深层次语义关联挖掘。
3.语义计算技术
语义计算技术利用语义相似度评估技术从概念、实例和关系三个层面对句子、词语等进行语义泛化;同时建立语义相关的上下文和背景知识网络,研究针对泛化产生的新的词语集合,对规则库中的逻辑规则、事实库中的结构化词语、以及上下文知识进行有效的激活,生成关键词和逻辑规则集合。
该方法实现了对关键词及其泛化结果的条件概率计算,最后通过研究局部概率图模型的有效实例化方法,输出最终的语义分析结果,提升了语义计算的高效和准确性。
司法场景中,语义计算技术帮助把案件分解为不同的要素,如时间、地点、人物、行为等,然后根据这些要素进行关联推理,找出与之相关的法律规定和判例,从而得出合理的结论或判断,帮助律师、法官等司法工作者更加高效地进行司法知识推理。
三、总结
案件信息深度应用服务平台通过技术牵引,有效缓解法院审判业务案多人少矛盾,尤其针对基层法院大量类型化简单案件,借助智能化手段提升法官审判效率;将类型化案件审理内容植入司法知识图谱,反向推动办案规范性提升;通过在线、异步、智能化方式降低诉讼参与人时间和金钱成本,提升诉讼便利程度。
来源:明朝万达