买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海朗晖慧科技术有限公司
摘要:本发明涉及语义分析的技术领域,公开了一种深度语义分析的电子合同任务分派方法,所述方法包括:对电子合同文本数据和任务内容文本数据进行编码处理;对编码处理得到的电子合同向量和任务内容向量进行重映射得到流形电子合同向量和流形任务内容向量;利用电子合同任务内容识别模型对流形电子合同向量进行任务内容识别,根据任务内容识别结果进行任务分派。本发明结合句向量之间的关联性,在不改变句向量本身语义的情况下,对每个句向量添加邻域句向量的语义实现重映射,使得重映射后每个句向量均可以表征本身以及邻域的语义信息,提高任务内容识别的有效性和准确性,促进电子合同内容的快速理解与实施,提高任务分派效率。
主权项:1.一种深度语义分析的电子合同任务分派方法,其特征在于,所述方法包括:S1:获取待分派的电子合同文本数据,并生成多种任务内容的文本数据,分别对电子合同文本数据和任务内容文本数据进行编码处理,得到电子合同向量和任务内容向量;获取待分派的电子合同文本并进行分词处理,得到待分派的电子合同文本数据:X=x1,x2,...,xn,...,xN其中:X表示待分派的电子合同文本数据,xn表示电子合同文本数据X中的第n个分词结果,N表示电子合同文本经分词处理得到的分词结果总数;其中电子合同文本中任意一句合同文本的分词处理流程为:预构建合同文本常用词词典,截取合同文本中前s个文本字符与合同文本常用词词典中的常用词进行比对匹配,若匹配不成功,则截取合同文本前s-1个文本字符与合同文本常用词词典中的常用词进行比对匹配,以此类推,直到比对成功或合同文本仅剩一个文本字符,将比对成功的合同文本字符作为匹配成功的分词结果,并在该句合同文本前删去分词结果,重新进行常用词比对匹配;生成多种任务内容的文本数据: 其中:表示第m种电子合同任务内容的文本数据,表示Ym中的第m个内容描述词汇,M表示所生成电子合同任务内容的种类数,K表示所生成每种电子合同任务内容的内容描述词汇总数;文本数据的编码处理流程为:S11:对电子合同文本数据中的任意分词结果及任务内容文本数据中的内容描述词汇进行独热编码表示,得到任意分词结果及内容描述词汇的独热编码表示结果;S12:根据文本数据中的标点符号将分词结果以及内容描述词汇归属到对应句子中,对分词结果进行权重计算: 其中:wxn表示分词结果xn的权重;exp·表示以自然常数为底的指数函数;Lxn表示分词结果xn所归属句子的句中分词结果总数,locxn表示分词结果xn在所属句子中的位置,即分词结果xn为所属句子的第locxn个分词结果;countxn表示分词结果xn在电子合同文本数据X中出现的次数;SumX表示电子合同文本数据X中的句子数,SumX,xn表示电子合同文本数据X中出现分词结果xn的句子数;并设置内容描述词汇的权重为1;S13:基于分词结果以及内容描述词汇的权重,对分词结果及内容描述词汇的独热编码表示结果进行重编码处理: 其中:zxn表示分词结果xn的重编码处理结果,表示内容描述词汇的重编码处理结果;wxn表示分词结果xn的权重,表示内容描述词汇的权重,其中WX表示预设的分词结果重编码矩阵参数,WY表示预设的内容描述词汇重编码矩阵参数;σ1·,σ2·表示激活函数,其中σ1·为ReLU激活函数,σ2·为Sigmoid激活函数;其中标点符号未进行重编码处理;S14:基于重编码处理结果,分别构成电子合同向量和任务内容向量:zX=zx1,zx2,...,zxn,...,zxN 其中:zX表示电子合同向量;zYm第m种电子合同任务内容的任务内容向量;S2:对编码处理得到的电子合同向量和任务内容向量分别进行重映射得到流形电子合同向量和流形任务内容向量;重映射流程为:S21:将电子合同向量和任务内容向量分别切分为句向量,得到电子合同句向量集合以及任务内容句向量集合: 其中: 表示电子合同句向量集合,SumX表示电子合同文本数据X中的句子数,zXj表示电子合同文本数据X中第j句文本数据的句向量; 表示第j句文本数据中第jnum个分词结果的重编码结果,jnum表示电子合同文本数据X中第j句文本数据内的分词结果数目; 表示第m种电子合同任务内容的任务内容句向量集合,zYmu表示第m种电子合同任务内容中第u句文本数据的句向量,SumYm表示第m种电子合同任务内容的句子数; 表示第j句文本数据中第mnumu个内容描述词汇的重编码结果,mnumu表示第j句文本数据内的内容描述词汇数目;S22:对于电子合同句向量集合中的任意电子合同句向量zXj,计算得到电子合同句向量zXj与电子合同句向量集合中其他电子合同句向量zXs的向量距离:diszXj,zXs=||zXj-zXs||2其中:diszXj,zXs表示电子合同句向量zXj与电子合同句向量zXs的向量距离,s∈[1,SumX],s≠j;||·||2表示L2范数;选取向量距离最近的jnum个电子合同句向量作为电子合同句向量zXj的邻域向量;S23:构建关于求解电子合同句向量重映射矩阵的目标函数: 其中:ΩjX表示电子合同句向量zXj的邻域向量集,c表示邻域向量集中的任意电子合同句向量;Wj,c表示电子合同句向量zXj与电子合同句向量c的重映射参数;||·||表示L1范数;利用拉格朗日乘子法对目标函数进行求解,得到电子合同句向量zXj的重映射矩阵Wj:Wj=[Wj,1,Wj,2,...,Wj,c,...,Wj,jnum]基于重映射矩阵对电子合同句向量zXj进行重映射处理,其中映射处理公式为: 其中:z*Xj表示电子合同句向量zXj的重映射结果;重复步骤S22-S23,得到电子合同句向量集合中所有电子合同句向量的重映射结果;S24:对于第m种电子合同任务内容的任意任务内容句向量,在第m种电子合同任务内容的任务内容句向量集合中获取邻域向量,并构建关于求解任务内容句向量重映射矩阵的目标函数进行重映射参数求解,进而构建得到重映射矩阵,基于重映射矩阵对任务内容句向量进行重映射处理,得到重映射结果,则zYmu的重映射结果为z*Ymu;S25:构建得到流形电子合同向量和流形任务内容向量:fX=z*X1,z*X2,...,z*Xj,...,z*XSumXfYm=z*Ym1,z*Ym2,...,z*Ymu,...,z*YmSumYm其中:fX表示流形电子合同向量;fYm表示第m种电子合同任务内容的流形任务内容向量;S3:构建电子合同任务内容识别模型,所述电子合同任务内容识别模型以流形电子合同向量和流形任务内容向量为输入,以流形电子合同向量对应的任务内容为输出;S4:利用电子合同任务内容识别模型对待分派电子合同文本数据的流形电子合同向量进行任务内容识别,根据任务内容识别结果对待分派的电子合同文本数据进行任务分派。
全文数据:
权利要求:
百度查询: 上海朗晖慧科技术有限公司 一种深度语义分析的电子合同任务分派方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。