买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:思创数码科技股份有限公司
摘要:本发明涉及数据处理技术领域,尤其涉及一种政策智能分析方法及系统,方法包括:获取政府发布的政策数据,对政策数据进行预处理,得到待提取文本;将待提取文本输入至预设的经预训练的SCBERT模型中,得到多条由主体、关系及客体组成的三元组数据;其中,SCBERT模型依次包括BERT层、BiLSTM层、Dropout层、CRF层、自注意力层和全连接层;基于三元组数据构建政策知识图谱,完成对政策的分析。本发明通过将待提取文本输入至SCBERT模型中,准确得到待提取文本中的多个三元组数据,再根据三元组数据构建政策知识图谱,将复杂的政策分析结果可视化的展现出来,降低了用户对政策理解和分析的难度。
主权项:1.一种政策智能分析方法,其特征在于,所述方法包括:获取政府发布的政策数据,对所述政策数据进行预处理,得到待提取文本;将所述待提取文本输入至预设的经预训练的SCBERT模型中,得到多条由主体、关系及客体组成的三元组数据;其中,所述SCBERT模型依次包括BERT层、BiLSTM层、Dropout层、CRF层、自注意力层和全连接层;其中,所述BERT层将所述待提取文本分解成由多个子词组成的标记序列,所述标记序列经所述BERT层进行转化输出得到第一隐状态矩阵,所述第一隐状态矩阵的每一行均与所述标记序列中的子词对应;将所述第一隐状态矩阵输入至BiLSTM层,由所述BiLSTM层输出第二隐状态矩阵;将所述第二隐状态矩阵经Dropout层处理后输入至CRF层,基于预设的多种主体标签,所述CRF层输出与所述第二隐状态矩阵对应的最优主体标签序列,根据所述最优主体标签序列中的所述主体标签的类别判断所述标记序列中的子词是否为所述主体;将所述最优主体标签序列进行向量转化,得到主体位置编码向量矩阵,将所述第一隐状态矩阵与所述主体位置编码向量矩阵进行特征融合,得到第一输出矩阵;将所述第一输出矩阵输入自注意力层中,得到第二输出矩阵;将所述第二输出矩阵输入至全连接层,所述全连接层中的全连接子层与预设的关系标签集合中的关系标签一一对应,根据所述全连接子层识别所述标记序列中的子词是否为所述客体,且与所述全连接子层对应的所述关系标签为所述全连接子层识别到的所述主体与所述客体对应的关系;将识别得到的所述主体、所述客体及所述主体与所述客体对应的关系进行整合,得到所述待提取文本中全部的所述三元组数据;基于所述三元组数据构建政策知识图谱,完成对政策的分析。
全文数据:
权利要求:
百度查询: 思创数码科技股份有限公司 一种政策智能分析方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。