首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于大语言模型的合同风险识别方法、计算机设备及可读存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:福建晨曦信息科技集团股份有限公司

摘要:本申请涉及人工智能技术领域,具体涉及一种基于大语言模型的合同风险识别方法、计算机设备及可读存储介质。本申请的方法包括以下步骤:构建用于合同条款风险识别的大语言模型和词向量模型;根据合同条款风险类别的名称和描述构建合同条款风险类别向量集合以及风险提示词集合;对待识别合同文本进行分割,得到合同条款集合以及对应的合同条款向量集合;遍历合同条款风险类别,将同类别的合同条款及风险提示词输入到大语言模型中获得该合同条款风险类别对应的合同条款风险。本申请的技术方案可有针对性地输出审核人员所关心类别的风险清单,通过对待识别合同文本的预处理以及引入大语言模型,来提高合同风险识别的处理效率和准确度。

主权项:1.一种基于大语言模型的合同风险识别方法,其特征在于,包括以下步骤:S1、使用合同样本数据对基础模型进行训练,得到用于合同条款风险识别的大语言模型CXLLM;S2、使用合同相关的法律法规样本数据对基础词向量模型进行训练,得到词向量模型CXWE;S3、设置合同条款风险类别的名称集合及其描述集合B,其中,n表示合同条款风险类别的数量,an表示第n个合同条款风险类别的名称,bn表示第n个合同条款风险类别的描述;S4、将所述名称集合A中的每个元素输入所述词向量模型CXWE向量化后得到向量集合;将所述描述集合B中的每个元素输入所述词向量模型CXWE向量化后得到向量集合VB;根据向量集合VA和向量集合VB计算得到合同条款风险类别向量集合VC=,计算公式为:=,其中,i的取值范围为1到n;S5、根据所述名称集合A中的每个元素生成其对应的风险提示词集合,其中,i的取值范围为1到n,n表示合同条款风险类别的数量,表示第i个元素对应的风险提示词集合,m表示第i个元素对应的风险提示词数量;S6、判断待识别的合同文本是否包含条款序号,若是则执行步骤S7,否则执行步骤S8;S7、采用条款序号作为分割标志,将待识别的合同文本分割后得到合同条款集合,其中,k表示合同条款数量,再将每个合同条款输入所述词向量模型CXWE向量化后得到合同条款向量集合VS;跳至步骤S10继续执行;S8、采用句号作为分割标志,将待识别的合同文本分割后得到合同条款临时集合,其中,t表示按句号分割后的合同条款数量,再将每个合同条款输入所述词向量模型CXWE向量化后得到合同条款临时向量集合;S9、将所述合同条款临时向量集合中的向量根据相似度进行合并后得到合同条款向量集合及其对应的合同条款集合,其中,k表示合同条款数量;S10、设置循环变量i的值为1;S11、从所述合同条款风险类别向量集合VC中取vci作为当前处理类别向量;S12、遍历合同条款向量集合VS,计算每个合同条款向量vsj与vci的相似度,将相似度值大于预设相似度阈值的合同条款向量vsj组成当前处理类别的合同条款向量集合SCi,所述与的相似度计算公式为:Sim=,其中,j取值范围为1至k,vsj表示同条款向量集合VS中第j个合同条款向量,a的取值范围为1至b,b表示合同条款向量VSj的元素个数,表示向量vsj的第a个元素,表示向量vci的第a个元素;S13、将当前处理类别的合同条款向量集合SCi中所有向量对应的合同条款合并成要检查的合同文本内容Pi;S14、获取当前处理类别向量对应的风险提示词集合Ti,将Ti中的风险提示词进行合并;S15、将合同文本内容Pi与合并后的风险提示词输入所述大语言模型CXLLM得到当前处理类别的合同条款风险;S16、判断循环变量i的值是否小于n,若是则执行步骤S17,否则执行步骤S18;S17、将循环变量i的值加1,跳至步骤S11继续执行;S18、输出所有合同条款风险类别对应的合同条款风险。

全文数据:

权利要求:

百度查询: 福建晨曦信息科技集团股份有限公司 基于大语言模型的合同风险识别方法、计算机设备及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。