首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

搜索数据库的倒排索引处理方法、装置、介质和设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:极限数据(北京)科技有限公司

摘要:本发明公开了一种搜索数据库的倒排索引处理方法、装置、介质和设备,将文档中的文本类型字段写入最新数据源内存的第一倒排索引结构,并同时将文档写入预写日志。当监测到预写日志中有文档写入时,后台线程创建第三倒排索引结构并写入文本类型字段。当第一倒排索引结构达到数据量阈值时,第一倒排索引结构停止写入并通知第三倒排索引结构也创建到预写日志中相同的位置,将创建的第三倒排索引结构写入数据源磁盘并在写入完成可以读取后创建新的数据源,并进行数据源切换。本发明中,文本类型字段会被写入专门设计的倒排索引结构中,因此在仅对倒排索引的过程处理中十分灵活。同时,创建的倒排索引结构可被实时搜索,这也有效提高了搜索效率。

主权项:1.一种搜索数据库的倒排索引处理方法,其特征在于,搜索数据库包括内存、磁盘、预写日志及后台线程,内存和磁盘中的数据作为数据源,原子量追踪最新数据源,在数据不断地被写入的过程中,新的数据源会被创建,数据源的版本对应增长,原子量被对应被更新,所述内存中初始创建有两个可被实时搜索的倒排索引结构,作为第一数据源,原子量初始追踪第一数据源,所述方法包括:获取上传的文档;将所述文档中的文本类型字段写入原子量追踪的最新数据源内存的第一倒排索引结构中,且将所述文档写入预写日志;其中,第一倒排索引结构为数据源中所述两个倒排索引结构中当前被写入的倒排索引结构,第二倒排索引结构为数据源中所述两个倒排索引结构中当前未被写入的倒排索引结构,第一倒排索引结构与第二倒排索引结构的结构相同;当所述后台线程监测到所述预写日志中有文档写入时,通过所述后台线程创建第三倒排索引结构,并将所述文档中的文本类型字段写入创建的第三倒排索引结构;当第一倒排索引结构写入的数据量达到阈值时,数据源准备进行切换,更新最新数据源,第一倒排索引结构停止写入并通知第三倒排索引结构也创建到预写日志中相同的位置,将创建完成的第三倒排索引结构写入所述磁盘,并在磁盘写入完成可以读取后创建第二数据源,在第一数据源的基础上,第二数据源包含第三倒排索引结构,且移除了第一倒排索引结构,将当前的第二倒排索引结构作为更新后的第一倒排索引结构,且创建新的倒排索引结构作为更新后的第二倒排索引结构,当第二数据源创建完成,对追踪最新数据源的原子量进行原子更新。

全文数据:

权利要求:

百度查询: 极限数据(北京)科技有限公司 搜索数据库的倒排索引处理方法、装置、介质和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。