买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川新网银行股份有限公司
摘要:本发明涉及一种应用深度学习提升舆情预警准确率的系统和方法,属于计算机技术领域。本发明包括命名实体识别终端:用于从数据输入端口获取新闻文本并输出命名实体矩阵及其置信概率矩阵P1;新闻事件分类终端:用于从数据输入端口获取新闻文本并输出风险事件类别E2及其对应的置信概率P2;新闻舆情预警终端:用于配制预警规则,接收命名实体矩阵及其置信概率矩阵P1、风险事件类别E2及其对应的置信概率P2,并执行预警规则,输出预警信号。本发明可自动从新闻文本中抽取命名实体,并且可同时预测数十种新闻事件的分类概率,输出分类概率矩阵与最高置信度的事件类别,大幅提高了新闻风险事件识别的准确率与详细程度。
主权项:1.一种应用深度学习提升舆情预警准确率的方法,其特征在于,包括以下步骤:步骤1:获取新闻文本,命名实体识别终端和新闻事件分类终端分别对新闻文本中的实体要素和风险事件进行标注,得到实体要素数据集D1和风险事件数据集D2;步骤2:分别采用实体要素数据集D1和风险事件数据集D2对命名实体识别模型和Transformer模型进行训练,得到训练好的命名实体识别模型M1和训练好的新闻舆情风险事件分类模型M2;步骤2.1:将实体要素数据集D1导入命名实体识别模型,命名实体识别模型采用BERT+IDCNN+CRF架构,对文本进行拆分操作,将实体要素数据集D1划分为训练集和验证集,然后加载预训练模型,在实体要素数据集D上进行微调,设置合适的初始化学习率和批处理大小,经过迭代得到训练好的命名实体识别模型M1;步骤2.2:将风险事件数据集D2导入Transformer模型,Transformer模型采用BERT架构,对文本进行拆分操作,将风险事件数据集D2划分为训练集和验证集,然后加载BERT预训练模型,初始化学习率和批处理大小,在风险事件数据集D2上进行微调操作,经过迭代得到训练好的新闻舆情风险事件分类模型M2;步骤3:将实时获取的新闻文本分别输入到训练好的命名实体识别模型M1和新闻舆情风险事件分类模型M2中,所述命名实体识别模型M1输出命名实体矩阵及其置信概率矩阵P1,所述新闻舆情风险事件分类模型M2输出风险事件类别E2及其对应的置信概率P2;步骤4:新闻舆情预警终端接收步骤3中的命名实体矩阵及其置信概率矩阵P1和风险事件类别E2及其对应的置信概率P2,并执行预警规则,输出预警信号。
全文数据:
权利要求:
百度查询: 四川新网银行股份有限公司 一种应用深度学习提升舆情预警准确率的系统和方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。