北京科技大学彭云峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京科技大学申请的专利一种面向知识融合中同义词词林的知识存储装置及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115098643B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210824405.1,技术领域涉及:G06F16/334;该发明授权一种面向知识融合中同义词词林的知识存储装置及方法是由彭云峰;崔洪振;张龙豪;邬雯设计研发完成,并于2022-07-13向国家知识产权局提交的专利申请。
本一种面向知识融合中同义词词林的知识存储装置及方法在说明书摘要公布了:一种面向知识融合中同义词词林的知识存储装置及方法,包括知识融合中的词语拆分及编码模块、改进树形存储结构、多元组存储形式的链表结构;所述知识融合中的词语拆分及编码模块对所述中文文本进行词语拆分、汉字编码、散列表存储;所述改进的树形存储结构对所述场景下的文本字、词构建树形存储结构,完成文本树形层级索引;所述多元组存储形式的链表结构对所述的知识融合中同义词词林进行磁盘存储,基于链表存储形式,创新构建同义词词林三元组存储结构,并设计前后指针索引。本发明具有检索效率高、准确率高的特点。
本发明授权一种面向知识融合中同义词词林的知识存储装置及方法在权利要求书中公布了:1.一种面向知识融合中同义词词林的知识存储装置,其特征在于,包括知识融合中的词语拆分及编码模块、改进树形存储结构、多元组存储形式的链表结构; 所述多元组存储形式的链表结构对所述的知识融合中同义词词林进行磁盘存储,基于链表存储形式,创新构建同义词词林三元组存储结构,并设计前后指针索引; 所述知识融合中的词语拆分及编码模块针对同义词词林完成词语拆分功能、汉字编码过程、散列表存储功能; 词语拆分功能包括:对中文文本词林中的词汇进行统一编号,依次完成同义词词语拆分和位置记录; 汉字编码过程包括依据《字符集和信息编码国家标准汇编》,对汉字进行编码; 散列表存储功能利用哈希散列技术确定汉字编码的唯一映射地址,并将汉字编码和映射地址存储在一块连续的存储空间即散列表中,为了避免散列表中出现的存储碰撞现象,采用开链法加以处理:通过在散列表的单向链表中继续检索,直到找到所需达到程序必要的停止条件;其地址域Key存储汉字哈希地址,Key对应的数据域Value存储树的根节点地址; 所述改进树形存储结构包括基于普通树形的常规定义和B+树叶子节点的定义,其中树的根节点地址存储在hash表的数据域Value中; 在树形非叶子节点设计中制定各层节点的数据内容存储格式,即非叶子节点不使用统一的存储格式; 改进树形存储结构用于存储、索引、排序和保存大量的词汇数据;其中,根节点(第0层)存储单个汉字,第1层子节点存储词语的字数,表示该词汇有几个汉字组成;第2层是存储抽象词语的节点,表示根结点在词汇中的位置;第3层叶子节点单独设计,将其存储结构设计为两个域,一个是数据域,用来存储该词语的具体词汇;另一个是指针域,用来存储该词语的同义词词汇集合在双向链表或双向循环链表中的存储位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。