买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于深度学习的舆情信息识别方法及系统,涉及数据识别技术领域,包括基于采集的舆情数据进行预处理,利用变换器Transformer模型对所述舆情数据进行学习并提取舆情特征,构建舆情识别模型;将所述舆情特征进行融合并得到综合时间序列特征;利用所述舆情识别模型对所述综合时间序列特征进行预测,得到舆情数据的未来趋势;基于实时更新机制对所述舆情识别模型进行更新。本发明通过利用变换器Transformer模型对舆情数据进行学习和特征提取,将趋势分析和周期性分析融合得到综合时间序列特征,更精准地分析出舆情的发展方向,辨别舆情的周期性波动,具备更强的语义理解能力和时序关联性,提高了舆情趋势的预测准确性和实时性。
主权项:1.一种基于深度学习的舆情信息识别方法,其特征在于:包括:基于采集的舆情数据进行预处理,利用变换器Transformer模型对所述舆情数据进行学习并提取舆情特征,构建舆情识别模型;将所述舆情特征进行融合并得到综合时间序列特征;利用所述舆情识别模型对所述综合时间序列特征进行预测,得到舆情数据的未来趋势;基于实时更新机制对所述舆情识别模型进行更新;趋势分析包括以下步骤:利用斜率检测分析舆情的时间序列数据的变化趋势;构建趋势分类器,将检测到的变化趋势进行分类;所述趋势分析的计算公式如下: 其中,ST为舆情的时间序列数据在时间点T的趋势分析得分;DT为舆情的时间序列数据在时间点T的值;k1为趋势分析的调节参数;所述趋势分析的具体情况如下:若舆情的时间序列数据在时间点T的趋势分析得分ST小于等于第一阈值,则判定舆情的时间序列数据的趋势为下降;若舆情的时间序列数据在时间点T的趋势分析得分ST大于第一阈值且小于第二阈值,则判定舆情的时间序列数据的趋势为平稳;若舆情的时间序列数据在时间点T的趋势分析得分ST大于第二阈值,则判定舆情的时间序列数据的趋势为上升;周期性分析包括以下步骤:引入傅里叶变换,分析舆情的时间序列数据的频域信息;构建周期性分析器,将通过傅里叶变换得到的频域信息转化为周期性信息;对不同频率的周期性信息进行分类和识别;所述周期性分析的计算公式如下: 其中,CT为舆情的时间序列数据在时间点T的周期性分析得分;N为傅里叶变换中考虑的频率数量;An为第n个频率的振幅;fn为第n个频率;φn为第n个频率的相位;若舆情的时间序列数据在时间点T的周期性分析得分CT大于等于第三阈值,则判定周期性强度显著;若舆情的时间序列数据在时间点T的周期性分析得分CT小于第三阈值,则判定周期性强度不显著;所述综合时间序列特征通过将检测到的变化趋势和周期性信息进行融合,进而得到综合时间序列特征;所述综合时间序列特征的计算公式如下:FT=α·ST+β·CT其中,FT为综合时间序列特征的得分;α为趋势分析的权重参数;β为周期性分析的权重参数;所述得到舆情数据的未来趋势通过构建舆情识别模型的输出层,进而预测舆情数据的未来趋势;所述预测舆情数据的未来趋势的计算公式如下: 其中,PT为未来舆情数据的预测值;k2为预测舆情数据未来趋势的调节参数;所述预测舆情数据的未来趋势的具体情况如下:若未来舆情数据的预测值PT小于第四阈值,则判定对舆情数据未来趋势的预测发生的概率低,即舆情数据未来趋势和过去的数据不相符;若未来舆情数据的预测值PT等于第四阈值,则判定对舆情数据未来趋势的预测发生的概率和不发生的概率相等,即舆情数据未来趋势和过去的数据存在相符性;若未来舆情数据的预测值PT大于第四阈值,则判定对舆情数据未来趋势的预测发生的概率高,即舆情数据未来趋势和过去的数据相符。
全文数据:
权利要求:
百度查询: 北京宏博知微科技有限公司 一种基于深度学习的舆情信息识别方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。