Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种舆情发布溯源方法、装置、设备及其存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本申请实施例属于数据处理技术领域,应用于对舆情数据的发布进行溯源场景中,涉及一种舆情发布溯源方法、装置、设备及其存储介质,包括获取目标舆情数据;对所有舆情数据进行关联性聚类整理;对聚类结果进行关键词提取,生成最新舆情关键词库;依次计算最新舆情关键词库与所有历史舆情关键词库的相似度;结合最大相似度,筛选该舆情数据对应的原创舆情数据。将所述舆情发布溯源方法,应用到金融新闻媒体数据的发布溯源场景中,能够通过中短期舆情的溯源,识别出繁杂的金融舆情数据中非法发布的金融指导数据和正规渠道发布的金融领域指导数据,帮助金融数据分析人员更加准确的进行金融情况分析,减少其分析决策结果被非法数据的影响程度。

主权项:1.一种舆情发布溯源方法,其特征在于,包括下述步骤:步骤201,获取目标信息平台在预设时间间隔内所发布的所有舆情数据;步骤202,根据预设的关联性识别策略,对所述所有舆情数据进行关联性聚类整理,获得初步聚类结果,其中,所述根据预设的关联性识别策略,对所述所有舆情数据进行关联性聚类整理,获得初步聚类结果的步骤,具体包括:根据预设的关联性表征公式:根据预设的关联性表征公式:,对所述所有舆情数据进行关联性聚类整理,其中,表示关联性表征值,表示两两舆情数据间的字词重复率,,表示发布者系数,表示发布者在当前舆情领域的创作权重,表示指定时间段内发布者发布的当前舆情领域舆情数据的数量,表示在所述指定时间段内发布者发布的所有舆情数据的总数量,的取值范围在区间之间,的取值范围在区间之间,;判断当前舆情数据和进行对比的舆情数据间是否存在转发、转载、引用关系;若存在转发、转载、引用关系,则,当前舆情数据和进行对比的舆情数据被聚类到同一聚类簇;若不存在转发、转载、引用关系,则采用方式,计算当前舆情数据和进行对比的舆情数据间的关联性表征值;若所述关联性表征值超过了预设的关联性阈值,则当前舆情数据和进行对比的舆情数据被聚类到同一聚类簇;若所述关联性表征值未超过所述关联性阈值,则当前舆情数据和进行对比的舆情数据被聚类到不同聚类簇;步骤203,对所有初步聚类结果进行关键词提取,生成每个初步聚类结果分别对应的最新舆情关键词库;步骤204,依次计算每个所述最新舆情关键词库分别与所有历史舆情关键词库的相似度;步骤205,通过比较方式,确定出每个所述最新舆情关键词库分别所对应的相似度最大的M个历史舆情关键词库,并记录最大相似度,其中,M为正整数;步骤206,判断所述最大相似度是否超过预设的相似度阈值,其中,在执行所述判断所述最大相似度是否超过预设的相似度阈值的步骤之前,所述方法还包括:步骤501,将当前最新舆情关键词库所对应的相似度最大的历史舆情关键词库设为目标词库;步骤502,通过查询,确定所述目标词库的生成时间;步骤503,计算所述目标词库的生成时间与当前系统时间的差值;步骤504,通过预设的时间相关性影响公式:,计算所述目标词库对应生成时间下的舆情数据对当前系统时间下的舆情数据的舆情影响系数,其中,表示所述舆情影响系数,表示所述目标词库的生成时间与当前系统时间的差值,表示第一设定时长,表示第二设定时长,表示一个固定的计算因子系数,;步骤505,通过对比,判断所述舆情影响系数是否超过了预设的舆情影响系数阈值;步骤506,若所述舆情影响系数超过了预设的舆情影响系数阈值,则执行步骤206;步骤507,若所述舆情影响系数未超过预设的舆情影响系数阈值,则从排序后的目标集合中筛选出下一位元素,并进行记录,将所述下一位元素对应的历史舆情关键词库更新为目标词库,执行步骤502至步骤505,直到所述舆情影响系数超过了预设的舆情影响系数阈值,则执行步骤206;若在所述排序后的目标集合中筛选完成且所有元素对应的舆情影响系数都未超过预设的舆情影响系数,则根据所述当前最新舆情关键词库对应的初步聚类结果中所有舆情数据的发布时间,进行比较,筛选出发布时间最早的舆情数据为原创舆情数据;步骤207,若所述最大相似度未超过预设的相似度阈值,则根据当前最新舆情关键词库对应的初步聚类结果中所有舆情数据的发布时间,进行比较,筛选出发布时间最早的舆情数据为原创舆情数据;步骤208,若所述最大相似度超过预设的相似度阈值,则采用前向迭代方式进行历史舆情关键词库反查,直到反查出原创舆情数据或者达到预设的迭代终止条件,迭代终止。

全文数据:

权利要求:

百度查询: 湖南数据产业集团有限公司 一种舆情发布溯源方法、装置、设备及其存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。