首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种舆情发布溯源方法、装置、设备及其存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南数据产业集团有限公司

摘要:本申请实施例属于数据处理技术领域,应用于对舆情数据的发布进行溯源场景中,涉及一种舆情发布溯源方法、装置、设备及其存储介质,包括获取目标舆情数据;对所有舆情数据进行关联性聚类整理;对聚类结果进行关键词提取,生成最新舆情关键词库;依次计算最新舆情关键词库与所有历史舆情关键词库的相似度;结合最大相似度,筛选该舆情数据对应的原创舆情数据。将所述舆情发布溯源方法,应用到金融新闻媒体数据的发布溯源场景中,能够通过中短期舆情的溯源,识别出繁杂的金融舆情数据中非法发布的金融指导数据和正规渠道发布的金融领域指导数据,帮助金融数据分析人员更加准确的进行金融情况分析,减少其分析决策结果被非法数据的影响程度。

主权项:1.一种舆情发布溯源方法,其特征在于,包括下述步骤:步骤201,获取目标信息平台在预设时间间隔内所发布的所有舆情数据;步骤202,根据预设的关联性识别策略,对所述所有舆情数据进行关联性聚类整理,获得初步聚类结果;步骤203,对所有初步聚类结果进行关键词提取,生成每个初步聚类结果分别对应的最新舆情关键词库;步骤204,依次计算每个所述最新舆情关键词库分别与所有历史舆情关键词库的相似度;步骤205,通过比较方式,确定出每个所述最新舆情关键词库分别所对应的相似度最大的M个历史舆情关键词库,并记录最大相似度,其中,M为正整数;步骤206,判断所述最大相似度是否超过预设的相似度阈值;步骤207,若所述最大相似度未超过预设的相似度阈值,则根据当前最新舆情关键词库对应的初步聚类结果中所有舆情数据的发布时间,进行比较,筛选出发布时间最早的舆情数据为原创舆情数据;步骤208,若所述最大相似度超过预设的相似度阈值,则采用前向迭代方式进行历史舆情关键词库反查,直到反查出原创舆情数据或者达到预设的迭代终止条件,迭代终止。

全文数据:

权利要求:

百度查询: 湖南数据产业集团有限公司 一种舆情发布溯源方法、装置、设备及其存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。