买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:成都西电网络安全研究院;西安电子科技大学
摘要:本发明公开了一种基于Doc2Vec模型的中文语义扩展查询方法,包括数据拥有者对需要上传至云端的文件集中的文档进行预处理,并基于Doc2Vec模型将中文共现语义矩阵的关键词表示转变为向量表示;授权用户通过搜索关键词并根据生成陷门的密钥生成查询陷门;云端服务器根据查询陷门加载安全索引集,并将检索信息返回给授权用户。本发明基于Doc2Vec模型进一步挖掘文档的潜在语义特征,提高搜索的准确性,还构造中文共现语义网络对用户输入的查询关键字做额外扩展,确保用户搜索结果的相关性;同时,将稀疏矩阵变为稠密矩阵,不仅大大节省索引的存储空间,同样降低了整个方案的执行时间。
主权项:1.一种基于Doc2Vec模型的中文语义扩展查询方法,其特征在于:包括以下步骤:S1:数据拥有者在本地初始化加密索引的密钥和加密文档的对称密钥;S2:数据拥有者对需要上传至云端的文件集中的文档进行预处理,文档的预处理为从每个文档中提取出关键词并构成关键词集合,利用关键词集合生成中文共现语义矩阵,并基于Doc2Vec模型将关键词表示转变为向量表示;S3:数据拥有者根据关键词集合和加密索引的密钥构建对应文档的安全索引集,同时对文件集中的文档根据对称密钥加密构建对应文档的密文集,将安全索引集和密文集上传至云端;S4:云端服务器收到安全索引集和密文集,并根据拥有者ID及拥有者上传文件集中的文件ID、文件名、文件存储地址和索引地址进行持久化存储;S5:数据拥有者将生成陷门的密钥和解密密钥传输给授权用户,授权用户通过搜索关键词并根据生成陷门的密钥生成查询陷门,并将查询陷门发送至云端服务器;S6:云端服务器收到授权用户发送的查询陷门后,加载安全索引集并执行检索算法,并向授权用户返回检索信息;S7:授权用户收到检索信息后,根据检索信息下载对应密文,并使用解密密钥将密文解密得到明文。
全文数据:
权利要求:
百度查询: 成都西电网络安全研究院 西安电子科技大学 一种基于Doc2Vec模型的中文语义扩展查询方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。