买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及数据处理领域,具体公开了一种支持检索的数据存储方法、索引方法及存储系统,包括将单个存储主体的内容与停用词表比对确定单个存储主体中的若干特征词;确定各特征词对于存储主体的表征能力参数;将存储主体的特征词以及特征词的表征能力参数生成为索引信息表并与存储主体共同存储,表征能力参数根据特征词的连续特征值和出现次数确定;通过表征能力参数的确定,考虑到了词语在存储主体内连续性与词语对于存储主体的表征能力的相关关系,能够在存储数据的同时兼顾对于数据的后期检索,保证了数据库内对应检索内容的有效索引,进而有效避免了对于数据无效检索现象的发生。
主权项:1.一种支持检索的数据存储方法,其特征在于,包括:将单个存储主体的内容与停用词表比对确定单个存储主体中的若干特征词;确定各特征词对于存储主体的表征能力参数;将存储主体的特征词以及特征词的表征能力参数生成为索引信息表并与存储主体共同存储;其中,所述特征词为排除所述停用词表包含的词语的情况下,在所述存储主体内出现次数排名前预设数量名次的词语;所述表征能力参数根据特征词的连续特征值和出现次数确定,且表征能力参数分别与所述连续特征值和所述出现次数成正相关;其中,针对文本类型的存储主体,连续特征值为连续的若干相同间隔的字段内,特征词连续出现的最大连续字段数量与存储主体包含的总字段数量的比值;针对视频或音频类型的存储主体,连续特征值为连续的若干相同间隔的时段内,特征词连续出现的最大连续时段数量与存储主体包含的总时段数量的比值。
全文数据:
权利要求:
百度查询: 中能数创(天津)科技有限公司 支持检索的数据存储方法、索引方法及存储系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。