买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工业大学
摘要:本发明提出了一种基于规范化张量分解的司法案例建模方法,涉及一种司法案例建模方法,尤其涉及一种基于规范化张量分解的司法案例建模方法,属于数据处理技术领域。包括以下步骤:步骤一.将司法案例进行模块分割;步骤二.将司法案例模块中的词汇过滤;步骤三.将司法案例模块矩阵化及张量生成;步骤四.将司法案例的原始张量分解为核张量,完成司法案例建模。解决了现有技术中存在的天然缺陷,不利于提高后续预测算法的准确率的技术问题,实现了无需大量的法律专业知识和人工标注工作,对数据库中词汇和语法信息的依赖性不强,能从各个层面描述司法案例,捕捉不同案例模块间的潜在关联,提高后续案例相关预测算法准确率。
主权项:1.一种基于规范化张量分解的司法案例建模方法,其特征在于,包括以下步骤:S1.将司法案例进行模块分割;S2.将司法案例模块中的词汇过滤;S3.将司法案例模块矩阵化及张量生成;S4.将司法案例的原始张量分解为核张量,完成司法案例建模;其中,步骤S1所述将司法案例进行模块分割具体包括:主体模块、客体模块、动机模块、行为模块和结果模块;所述主体模块包含犯罪嫌疑人信息;所述客体模块包含受害人信息;所述动机模块包含事件信息;所述行为模块包含作案过程和案件发展;所述结果模块包含受害方损失、造成的社会影响以及严重后果;步骤S2所述将司法案例进行模块词汇过滤的包括词汇消减、词汇排序、词汇剪切或填充;所述词汇消减包括对每一个案例模块中的语句进行分词、去停用词,去除原始语句中的无意义词汇,同时保留法律领域专业术语;所述词汇排序包括对每一个案例模块中的词汇进行排序;所述词汇剪切或填充包括设置案例模块标准长度,对每个案例模块中的词汇进行裁剪或者补缺,使其长度相同;步骤S3所述的司法案例模块矩阵化包括将每个司法案例模块中的词汇向量化,将语料库中的one-hot向量转换为低维稠密向量,对于经过词汇填补操作的案例模块用空白词汇用零向量、均值向量或者随机向量表示;每一个司法案例模块被表示为具有相同维度的矩阵形式,联合三维空间中每一个案例的案例模块矩阵,得出司法案例的张量表示;步骤S4所述将司法案例的原始张量分解为核张量的具体算法如下: 令使其其中,χ为司法案例的原始张量,W为司法案例模块矩阵,I1表示司法案例模块的数量,I2表示每个司法案例模块中词汇的数量,IN表示司法案例模块中每个词汇量的纬度;核张量满足如下条件: 其中,为核张量,{Un}为映射矩阵集合,{Un}与使目标函数φ取得最小值,且
全文数据:
权利要求:
百度查询: 哈尔滨工业大学 一种基于规范化张量分解的司法案例建模方法、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。