千舆网络科技(上海)有限公司苏旋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉千舆网络科技(上海)有限公司申请的专利一种非结构化数据的语义增强存储与分布式检索系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121092721B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511213376.5,技术领域涉及:G06F16/36;该发明授权一种非结构化数据的语义增强存储与分布式检索系统是由苏旋设计研发完成,并于2025-08-28向国家知识产权局提交的专利申请。
本一种非结构化数据的语义增强存储与分布式检索系统在说明书摘要公布了:本发明涉及数据处理技术领域,尤其涉及一种非结构化数据的语义增强存储与分布式检索系统,所述系统通过数据采集模块对目标非结构化数据进行采集,还通过语义分析模块对目标非结构化数据进行编码,还通过语义增强模块对进行模糊数据监测,还通过语义存储模块进行数据分片存储,还通过分布式检索模块对分布式并行检索方案进行获取,本发明通过对目标非结构化数据进行采集,并根据目标非结构化数据进行语义分析、语义增强与数据存储,还对分布式并行检索方案进行实时获取,以便于增强目标非结构化数据语义的同时对目标非结构化数据进行高效的存储与检索。
本发明授权一种非结构化数据的语义增强存储与分布式检索系统在权利要求书中公布了:1.一种非结构化数据的语义增强存储与分布式检索系统,其特征在于,所述系统包括: 数据采集模块,用以对目标非结构化数据进行采集; 语义分析模块,用以对目标非结构化数据进行统一编码,得到编码后非结构化数据,并根据编码后非结构化数据对数据关联知识图谱进行构建; 语义增强模块,用以根据疏性相似判断对齐占比对数据关联知识图谱进行图谱更新,还用以对编码后非结构化数据进行模糊数据监测,并根据冷热占比对模糊数据监测的过程进行存储优化; 分片存储数据库,设置于系统平台云端,用以对编码后非结构化数据进行存储; 语义存储模块,用以根据分片存储数据库对数据分片存储方案进行获取,还用以对分片数据库进行获取,并对编码后非结构化数据进行隐私判定,并根据隐私判定结果对分片数据库进行隐私标记; 分布式检索模块,用以根据编码后非结构化数据对分布式并行检索方案进行获取,还用以对检索任务优先级进行获取,并对检索任务优先级进行拆分优化,还用以根据资源争抢状态持续时间对统一编码的过程进行力度优化; 所述语义增强模块包括: 疏性相似判断单元,用以根据疏性相似判断模型对疏性相似判断对齐占比进行获取,并根据疏性相似判断对齐占比对数据关联知识图谱进行图谱更新; 模糊数据监测单元,用以对编码后非结构化数据进行模糊数据监测,得到数据监测结果,并根据数据监测结果对数据关联知识图谱进行图谱优化; 数据监测优化单元,用以根据冷热占比对模糊数据监测的过程进行存储优化; 所述疏性相似判断单元根据疏性相似判断模型对疏性相似判断对齐占比进行获取,根据疏性相似判断对齐占比对数据关联知识图谱进行图谱更新,将关联属性为不关联的第一关联实体编码数据和第二关联实体编码数据输入疏性相似判断模型,得到疏性相似判断模型输出的疏性相似判断对齐占比zp; 所述疏性相似判断单元根据疏性相似判断对齐占比对数据关联知识图谱进行图谱更新,将所述疏性相似判断对齐占比zp与预设疏性相似判断对齐占比zp0进行比对,根据比对结果对疏性相似判断对齐占比的情况进行判断,并根据判断结果对数据关联知识图谱进行图谱更新,其中: 当zp≤zp0时,所述疏性相似判断单元判定疏性相似判断对齐占比的情况为低占比,不对数据关联知识图谱进行图谱更新; 当zp>zp0时,所述疏性相似判断单元判定疏性相似判断对齐占比的情况为高占比,对数据关联知识图谱进行图谱更新:将关联属性为不关联的第一关联实体编码数据和第二关联实体编码数据加入实体列表进行储存; 所述模糊数据监测单元对编码后非结构化数据进行模糊数据监测,将编码后非结构化数据输入数据关联知识图谱,得到数据关联知识图谱输出的关联结果,将编码后非结构化数据和所述关联结果输入关联置信度判定模型,得到关联置信度判定模型输出的关联结果置信度zc,将所述关联结果置信度zc与预设关联结果置信度zc0进行比对,根据比对结果对关联结果置信度的达标程度进行判断,并根据判断结果对模糊数据监测结果进行输出,其中: 当zc≥zc0时,所述模糊数据监测单元判定关联结果置信度的达标程度为达标,将编码后非结构化数据不是模糊数据作为数据监测结果进行输出; 当zc<zc0时,所述模糊数据监测单元判定关联结果置信度的达标程度为不达标,将编码后非结构化数据是模糊数据作为数据监测结果进行输出,并根据数据监测结果对数据关联知识图谱进行图谱优化; 所述模糊数据监测单元根据数据监测结果对数据关联知识图谱进行图谱优化,根据图谱优化系数cv对预设汉明距离dh0进行图谱优化,设定cv=0.66+0.25×e-zc0-zc,设定优化后预设汉明距离为dh0’,设定dh0’=dh0×cv,将所述优化后预设汉明距离dh0’作为预设汉明距离dh0进行输出,并将所述汉明距离dh与预设汉明距离dh0重新进行比对,得到关联属性为不关联的第一关联实体编码数据和第二关联实体编码数据,并将关联属性为不关联的第一关联实体编码数据和第二关联实体编码数据重新输入疏性相似判断模型; 所述数据监测优化单元根据冷热占比对模糊数据监测的过程进行存储优化,根据数据访问频率pm、数据重要程度zm、数据访问频率权重w1和数据重要程度权重w2对数据冷热值LR进行计算,设定LR=pm×w1+zm×w2,得到数据冷热值LR,将所述数据冷热值LR与预设数据冷热值LR0进行比对,根据比对结果对数据冷热值的状态进行判断,并根据判断结果对编码后非结构化数据的冷热属性进行输出,其中: 当LR≤LR0时,所述数据监测优化单元判定数据冷热值的状态为冷状态,将冷属性作为编码后非结构化数据的冷热属性进行输出,并对编码后非结构化数据进行抽样存储; 当LR>LR0时,所述数据监测优化单元判定数据冷热值的状态为热状态,将热属性作为编码后非结构化数据的冷热属性进行输出,并对编码后非结构化数据进行全部存储,还将编码后非结构化数据加入特征提取模型的训练集中; 所述数据监测优化单元根据冷属性数据数量mc和编码数据总数量mz对冷属性数据占比cmc进行计算,设定cmc=mcmz,得到冷属性数据占比cmc; 所述数据监测优化单元根据热属性数据数量mh和编码数据总数量mz对热属性数据占比hmh进行计算,设定hmh=mhmz,得到热属性数据占比hmh; 将所述冷属性数据占比cmc与热属性数据占比hmh进行比对,根据比对结果对冷热属性占比情况进行判断,并根据判断结果对预设关联结果置信度zc0进行存储优化,其中: 当cmc≥hmh时,所述数据监测优化单元判定冷热属性占比情况为冷属性数据居多,不对预设关联结果置信度zc0进行存储优化; 当cmc<hmh时,所述数据监测优化单元判定冷热属性占比情况为热属性数据居多,根据存储优化系数cv对预设关联结果置信度zc0进行存储优化,设定cv=1.56-0.22×e-hmh-cmc,其中,e为自然对数的底,设定优化后预设关联结果置信度为zc0’,设定zc0’=zc0×cv,将所述优化后预设关联结果置信度zc0’作为预设关联结果置信度zc0进行输出,并将所述关联结果置信度zc与预设关联结果置信度zc0重新进行比对; 所述分片存储数据库设置于系统平台云端,用以对分片方案进行存储,所述分片方案包括将预设编码后非结构化数据作为索引和将与预设编码后非结构化数据对应的数据分片存储方案作为关联结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人千舆网络科技(上海)有限公司,其通讯地址为:201805 上海市嘉定区安亭镇新源路58号708室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励