买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:曲慧娟
摘要:本发明公开了一种基于数据分析的风险监测预警系统及方法,属于数据存储技术领域。通过对用户、文件和操作行为进行监测预警,降低数据丢失风险概率。该系统包括数据采集模块、数据处理模块、运行管理模块和数据备份模块;所述数据采集模块用于采集指定区域内所有用户的操作信息,以及用户计算机内的文件信息;所述数据处理模块通过操作信息和文件信息筛选出数据漏存率高的用户,对这些用户计算机内的文件进行分析判断,找出重点文件进行监测;所述运行管理模块用于对重点文件的操作进行风险程度分析,高风险操作情况下及时给用户发送预警信息,根据用户回馈进行对应操作;所述数据备份模块用于对用户需要保存的文件进行备份。
主权项:1.一种基于数据分析的风险监测预警系统,其特征在于:该预警系统包括数据采集模块、数据处理模块、运行管理模块和数据备份模块;所述数据采集模块用于采集所有用户的操作信息,以及用户计算机内的文件信息;所述数据处理模块通过操作信息和文件信息筛选出数据漏存率高的异常用户,对这些异常用户计算机内的文件进行分析判断,找出重点文件进行监测;所述运行管理模块用于对重点文件的操作进行风险程度分析,高风险操作情况下及时给用户发送预警信息,根据用户回馈进行对应操作;所述数据备份模块用于对用户需要保存的文件进行备份;对异常用户的筛选步骤如下:S101、获取指定区域内所有用户的操作信息,以及用户计算机内的文件信息;操作信息包括打开操作、关闭操作、清理操作和保存操作,以及这些操作对应的时间;文件信息包括文件格式、文件名称和有效期;S102、识别每个用户打开操作的失败次数,打开失败是指用户打开文件时,对应文件超过有效期被系统自动清理了,文件无法被打开导致打开失败;筛选出打开失败次数不为零的用户,对这些用户进行标记;S103、获取被标记的用户计算机中保存文件的数量,与对应用户打开文件失败次数一起代入公式中,计算得到文件漏存率,依次筛选出文件漏存率大于漏存率阈值的用户,将这些用户定义为异常用户;公式如下: 式中,result为用户类型判断结果,e为用户打开失败次数,f为用户保存文件的数量,F为漏存率阈值;检测重点文件的步骤如下:S201、获取所有异常用户计算机内的文件信息,按照是否被用户保存进行分类,划分为已存文件和未存文件;已存文件是指被用户保存的文件,未存文件是指没有被用户保存且没有超过有效期的文件;S202、获取未存文件对应的操作信息,判断打开操作与关闭操作时间差,将该时间差定义为该文件的浏览时间;判断浏览时间是否大于时间阈值,结果为是,则将对应文件定义为重点文件,进入下一步骤;结果为否,则直接进入下一步骤;S203、获取已存文件的格式信息,将这些信息放入格式信息集合X中,集合X内包括{Q1,Q2,Q3,...,Qi},其中,i表示格式信息个数,Qi表示第i个格式信息的值;S204、获取已存文件的名称信息,将这些信息放入名称信息集合Y中,集合Y内包括{W1,W2,W3,...,Wj},其中,j表示名称信息个数,Wj表示第j个名称信息的值;S205、获取剩余没有被定义的未存文件的格式信息,依次判断是否属于格式信息集合,结果为是,则将对应的未存文件进行标记;结果为否,则将对应文件定义为普通文件;S206、获取被标记文件的名称信息,依次与名称信息集合中每一个元素进行相似度计算,得到的相似度放入相似度集合Z中,每份被标记文件对应一个相似度集合,相似度计算步骤如下:S206-1、对文件名称进行分词处理,将每个名称转化为一个词语列表;S206-2、去除每个词语列表中的重复词语,得到两个不同的词语集合;S206-3、将两个不同的词语集合合并,得到总词语集合;S206-4、将总词语集合中的每个词语构建出一个向量,向量的每一维表示该词语在文本中出现的次数;使用公式计算两个向量之间的相似度,公式如下: 式中,cosθ为文件名称的相似度,|a|表示向量a的模,|b|表示向量b的模,a×b表示向量a和向量b的内积;S207、判断每份被标记文件对应相似度集合中最大的数是否大于相似度阈值,结果为是,则将对应文件定义为重点文件;结果为否,则将对应文件定义为普通文件;判断公式如下: 式中,FT为文件类型,GS为文件格式,X为格式信息集合,maxZ为文件相似度集合中最大值,Z阈为相似度阈值,Tend为文件关闭时间,Tstart为文件打开时间,T阈为时间阈值。
全文数据:
权利要求:
百度查询: 曲慧娟 一种基于数据分析的风险监测预警系统及方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。