Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

新闻舆情监测系统专利

发布时间:2018-12-19 12:09:24 来源:龙图腾网 导航: 龙图腾网> 最新专利技术> 新闻舆情监测系统

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:成都布林特信息技术有限公司

申请日:2015-01-09

公开(公告)日:2017-09-29

公开(公告)号:CN104504150B

专利技术分类:

专利摘要:本发明公开了一种新闻舆情监测系统,该系统包括新闻信息采集模块、新闻数据预处理模块、新闻舆情分析模块和新闻舆情结果显示模块;所述新闻数据预处理模块包括:初步过滤子模块、正文提取子模块、分词子模块、特征短语过滤子模块、文本情感倾向性分析子模块、图片分析子模块、以及舆情热度获取子模块;针对新闻数据预处理模块预处理后的数据,通过分布式的云计算方式,使用多种新闻舆情监测算法子模块来获取新闻舆情热点,并对获取的新闻舆情热点进行综合判断分类评估,从而实现对新闻舆情热点话题较高效、准确的监测。

专利权项:一种新闻舆情监测系统,该系统包括新闻信息采集模块1、新闻数据预处理模块2、新闻舆情分析模块3和新闻舆情结果显示模块4,其中新闻信息采集模块1用于对互联网上的新闻舆情信息进行采集,获取新闻数据;新闻数据预处理模块2用于将新闻信息采集模块1获取的新闻数据中的无用信息去除,并对去除了无用信息的所述新闻数据进行整理;新闻舆情分析模块3以新闻数据预处理模块2整理的新闻数据为基础,采用多个新闻热点发现子模块发现新闻舆情热点;新闻舆情结果显示模块4以图表或报告形式输出新闻舆情分析结果,实现用户交互功能;所述新闻信息采集模块1用于根据指定的关键词、来源URL或信息主题,使用基于链接分析的搜索引擎网络爬虫方法,通过多线程下载队列并发地自动采集多种类型的新闻舆情信息;其中,所述多种类型的新闻舆情信息至少包括新闻的文本信息和或图片信息;并且所述新闻数据预处理模块2包括:初步过滤子模块2a、正文提取子模块2b、分词子模块2c、特征短语过滤子模块2d、文本情感倾向性分析子模块2e、图片分析子模块2f和舆情热度获取子模块2g;所述初步过滤子模块2a,用于对新闻数据中的信息进行初步过滤,清除所述新闻数据中的噪声,对每条新闻数据进行以下处理:步骤2a‑1,对于每条新闻数据,按照标题进行语义分析,检测出网络中与该条新闻数据相似的所有新闻数据,得到该条新闻数据的相似组;如果未发现与该条新闻数据相似的新闻数据,则该条新闻数据的相似组为其本身;步骤2a‑2,对于每条新闻数据,将网络中所有位置出现的该条新闻数据的相似组中所有新闻数据的总数量除以发布该条新闻数据的相似组中所有新闻数据的网络地址的总数量,得到该条新闻数据的空间重复度值S1;步骤2a‑3,对于每条新闻数据,计算网络中出现的该条新闻数据的相似组中所有新闻数据的总数量,得到该条新闻数据的时间重复度值S2;步骤2a‑4,根据每条新闻数据的空间重复度值S1和时间重复度值S2计算该条新闻数据的综合重复度值S,并进行阈值判断,如果所述综合重复度值S超过阈值,则过滤掉该条新闻数据及其相似组;其中,所述综合重复度值S通过以下公式计算:S=log2S1+5012+log2S2+2012+lgS1*lgS214。

百度查询: 成都布林特信息技术有限公司 新闻舆情监测系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。