首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向裁判文书的文档级智能问答实现方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国司法大数据研究院有限公司

摘要:本发明公开了一种面向裁判文书的文档级智能问答实现方法,其步骤包括:1获取目标裁判文书;2采对裁判文书的内容进行分割得到多个文本块,生成每一所述文本块的表示向量并存入文书向量数据库VB1中;3根据从裁判文书中抽取的实体、关系和属性构建一知识图谱,根据知识图谱中每一三元组生成一知识条目,构建知识集合;将知识条目转为表示向量存入知识向量数据库VB2中;4根据用户的问题Q生成一问题向量;5将问题向量分别与VB1、VB2中每一表示向量进行文本相似度计算,获取相似文本集A1、相似知识集A2;6基于A1、A2,采用大语言模型生成标准答案输出。本发明提升了面向裁判文书问答的准确率。

主权项:1.一种面向裁判文书的文档级智能问答实现方法,其步骤包括:1获取目标文书,所述目标文书为用户待分析的裁判文书;2采用文书分段技术对所述裁判文书的内容进行分割得到多个文本块,生成每一所述文本块的表示向量并存入文书向量数据库VB1中;3根据从所述裁判文书中抽取的实体、关系和属性构建一知识图谱,根据所述知识图谱中每一三元组实体、关系、属性生成一知识条目,构建由多个所述知识条目组成的知识集合;将所述知识集合中的知识条目转为表示向量存入知识向量数据库VB2中;其中,得到所述向量数据库VB2的方法为:31采用UIE统一信息提取模型从所述裁判文书中抽取的实体、关系和属性,构建裁判文书基本信息知识库;根据所述裁判文书基本信息知识库构建一知识图谱;32基于所述裁判文书基本信息知识库和设定的提示指令,利用大语言模型采用思维链的方式识别所述裁判文书中的案件特征、生成争议焦点,构建案情知识库;采用大语言模型对案件特征进行识别时,采用的提示指令中的信息包含:事实认定段内容、本院认为段内容、案件特征名称、基于特征构建的思维链语料以及识别案件特征的提示语料;采用大语言模型获取生成争议焦点时所采用的提示指令中包含的信息有:诉称段信息、辩称段信息以及生成争议焦点的提示语料;33基于步骤31提取的法律法规名称从法律法规库中提取相关的法律法规内容、关联法条、沿革信息、法条释义、法律法规关联的案例、关联的裁判规则,构建法规知识库;34基于所述裁判文书基本信息知识库、案情知识库和法规知识库,采用设定的人类语言规则将所述知识图谱中每一三元组实体、关系、属性组合成一段话作为一条知识条目,构建所述知识集合;然后将所述知识集合中的知识条目转为表示向量存入知识向量数据库VB2中;4根据用户的问题Q生成一问题向量;5将所述问题向量与所述文书向量数据库VB1中每一表示向量进行文本相似度计算,获取相似文本集A1;将所述问题向量与所述知识向量数据库VB2中每一表示向量进行文本相似度计算,获取相似知识集A2;6基于步骤5所得相似文本集A1、相似知识集A2,采用大语言模型生成所述问题Q的标准答案输出;其中,首先构建所述大语言模型解答用户问题的提示指令模版,包含相似文本槽、相似知识槽、问题槽及解答问题的提示语料;然后将所述相似文本集A1中的文本采用分隔符拼接成一段文本内容,并将其代入所述相似文本槽中;将所述相似知识集A2中的知识采用分隔符拼接成一段文本内容,并将其代入所述相似知识槽中,将所述问题Q代入所述问题槽中,生成一提示指令;然后将所述提示指令传给所述大语言模型,生成所述问题Q的标准答案输出。

全文数据:

权利要求:

百度查询: 中国司法大数据研究院有限公司 一种面向裁判文书的文档级智能问答实现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。