首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于云计算的文档数据检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东至信信息科技股份有限公司

摘要:本发明涉及文档错误检测技术领域,具体公开了一种基于云计算的文档数据检测方法,用于解决现有技术加密后的文档数据不再保留词语之间的自然联系和上下文关系,导致检索结果无法完全反映原文的实际含义,从而无法匹配加密文档中的正确关键词,降低了检索精度的问题;本发明通过获取第一匹配参数以及第二查询参数,将第一匹配参数导入至第一错误检测判别模型中,进行第一错误检测值的计算,并进行第一错误检测值的判别,通过将第一错误检测值以及第二查询参数导入至第二检测精度值分析模型中,进行第二检测精度值的计算,确保用户查询时能够匹配到正确的加密文档数据,提高了加密文档数据的检索精度。

主权项:1.一种基于云计算的文档数据检测方法,其特征在于,包括如下步骤:S1、获取目标关键词的第一匹配参数;S2、获取用户查询目标关键词时的第二查询参数;S3、将第一匹配参数导入至第一错误检测判别模型中,进行第一错误检测值的计算,并进行第一错误检测值的判别;S4、将第一错误检测值以及第二查询参数导入至第二检测精度值分析模型中,进行第二检测精度值的计算;S5、提取历史第一匹配参数、历史第二查询参数以及历史第二检测精度值,构建以历史第一匹配参数以及历史第二查询参数为输入,以历史第二检测精度值为输出的神经网络模型;在S3中,将第一匹配参数导入至第一错误检测判别模型中,进行第一错误检测值的计算,并进行第一错误检测值的判别,具体步骤为:S31、提取第一匹配参数中目标关键词的同义词匹配率、近义词匹配率、扩展关键词覆盖率以及主题词覆盖率;S32、将第一匹配参数中目标关键词的同义词匹配率、近义词匹配率、扩展关键词覆盖率以及主题词覆盖率导入至第一错误检测判别模型中,进行第一错误检测值的计算,第一错误检测判别模型的公式为: 式中:rwa为第一错误检测值,pta为目标关键词a的同义词匹配率,pja为目标关键词a的近义词匹配率,pka为目标关键词a的扩展关键词覆盖率,pza为目标关键词a的主题词覆盖率,n为目标关键词的个数;S33、提取第一错误检测值,将第一错误检测值与预设的第一错误检测阈值进行比较,若第一错误检测值大于等于预设的第一错误检测阈值,则第一错误检测值不合格;若第一错误检测值小于预设的第一错误检测阈值,则第一错误检测值合格;在S4中,将第一错误检测值以及第二查询参数中的用户查询目标关键词的点击率、跳出率、查询修改频率以及每次检索的平均查询次数导入至第二检测精度值分析模型中,进行第二检测精度值的计算,具体步骤为:S41、提取第一错误检测值以及第二查询参数中的用户查询目标关键词的点击率、跳出率、查询修改频率以及每次检索的平均查询次数;S42、将第一错误检测值以及第二查询参数中的用户查询目标关键词的点击率、跳出率、查询修改频率以及每次检索的平均查询次数导入至第二检测精度值分析模型中,进行第二检测精度值的计算,第二检测精度值分析模型的公式为: 式中:cdb为第二检测精度值,rwa为第一错误检测值,da为用户查询目标关键词a的点击率,dta为用户查询目标关键词a的跳出率,fa为用户查询目标关键词a的查询修改频率,cja为用户查询目标关键词a时的每次检索的平均查询次数,n为目标关键词的个数。

全文数据:

权利要求:

百度查询: 山东至信信息科技股份有限公司 一种基于云计算的文档数据检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。