买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及智能司法辅助技术领域,尤其是提供了基于文本掩码与对比策略的多角色识别方法。该方法包括根据姓名数据库构建主从犯成对的训练数据集;将训练数据集中的掩码后的犯罪事实文本和罪责标签,得到基于犯罪事实的被告责任推理模型;将标签广播向量和文本嵌入向量进行嵌入相加增强,得到基于法院陈述的被告角色识别模型;通过调用基于犯罪事实的被告责任推理模型或基于法院陈述的被告角色识别模型,获得罪责推理结果或罪责识别结果,该方法在复杂的多角色案件中,可以结合语义信息和上下文分析从犯罪事实描述中推理出主犯与从犯罪责,并从法院陈述中识别出主犯与从犯角色,为司法决策提供了可靠的参考依据,提升了司法效率和司法公正性。
主权项:1.一种基于文本掩码与对比策略的多角色识别方法,其特征在于,所述方法包括:步骤一、基于正则化技术,从裁判文书提取犯罪事实、法院陈述所有被告人的姓名及其罪责标签,罪责为主犯或从犯;步骤二、对于提取的每位被告人,在裁判文书的犯罪事实文本或法院陈述文本对其姓名进行MASK掩码操作,并对掩码后的法院陈述文本进行精炼,获得每位被告人掩码后的犯罪事实文本或精炼后的法院陈述文本;步骤三、以每位被告人的姓名作为关键词,构建姓名【掩码后的犯罪事实文本,精炼后的法院陈述文本,罪责标签】数据库;并根据姓名数据库构建主从犯成对的训练数据集;步骤四、将训练数据集中的掩码后的犯罪事实文本和罪责标签输入到基于bert-base-chinese基座的分类模型中,对基于bert-base-chinese基座的分类模型进行有监督训练,经过多轮次优化,得到基于犯罪事实的被告责任推理模型;步骤五、将基于犯罪事实的被告责任推理模型输出的主从犯预测标签进行映射,获得标签广播向量;将精炼后的法院陈述文本嵌入基于bert-base-chinese基座的分类模型中,进行文本嵌入编码和多头注意力计算,得到文本嵌入向量;步骤六、将标签广播向量和文本嵌入向量进行嵌入相加增强,并输入基于bert-base-chinese基座的分类模型的前馈层进行参数优化,以训练数据集中的罪责标签作为训练的目标标签进行有监督训练,经过多轮次优化,得到基于法院陈述的被告角色识别模型;步骤七、通过调用基于犯罪事实的被告责任推理模型或基于法院陈述的被告角色识别模型,获得罪责推理结果或罪责识别结果。
全文数据:
权利要求:
百度查询: 山东大学 基于文本掩码与对比策略的多角色识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。