北京鸿鹄云图科技股份有限公司贾若获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京鸿鹄云图科技股份有限公司申请的专利结合OCR识别的PDF文档智能检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121030070B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511484590.4,技术领域涉及:G06F16/93;该发明授权结合OCR识别的PDF文档智能检索方法及系统是由贾若;何小敏;郑俐;赵晓;刘从清设计研发完成,并于2025-10-17向国家知识产权局提交的专利申请。
本结合OCR识别的PDF文档智能检索方法及系统在说明书摘要公布了:本发明公开了结合OCR识别的PDF文档智能检索方法及系统,涉及光学字符识别技术领域,方法包括:在信息化平台输入检索词条,执行词条转换与OCR增强,确定增强词条体系;再对其设定跳视检索机制,生成基于概念变迁路径的动态检索链;最后通过交互线程写入寄存器,在文档数据库内进行动态OCR检索,确定并弹窗显示PDF检索单。本发明解决了传统PDF文档检索方法难以处理多源异构PDF中的图像化文字等内容,导致数据处理后的检索结果片面、关联性弱,无法满足精准高效的检索的技术问题,达到了对多源异构PDF中图像化文字等内容的有效处理,使数据处理后的检索结果更全面、关联性更强,满足精准高效检索的技术效果。
本发明授权结合OCR识别的PDF文档智能检索方法及系统在权利要求书中公布了:1.结合OCR识别的PDF文档智能检索方法,其特征在于,所述方法包括: 在信息化平台输入检索词条,执行词条转换与OCR增强,确定增强词条体系,其中,增强维度包含扩展增强与矛盾论增强,矛盾论增强以基于词条语义的对立或互补为增强导向; 对所述增强词条体系进行跳视检索机制设定,生成基于概念变迁路径的动态检索链,其中,以基于焦点移动的动态光学字符识别为设定原则; 以文档数据库与检索端的交互线程,将所述动态检索链写入寄存器,在所述文档数据库内进行PDF文档的动态OCR检索,确定PDF检索单,在信息化平台的检索窗口进行弹窗显示; 对所述增强词条体系进行跳视检索机制设定,生成基于概念变迁路径的动态检索链,包括: 针对所述增强词条体系,划分多个局部体系,其中,同要素单元同源性为分割依据; 根据所述多个局部体系,进行级联焦点确定,其中,所述级联焦点包含第一焦点与第二焦点,所述第一焦点为多个局部体系中至少一个局部体系,所述第二焦点为所述第一焦点中至少一个要素单元; 以所述多个局部体系与所述级联焦点,生成动态检索链; 以所述多个局部体系与所述级联焦点,生成动态检索链,包括: 根据第一级联焦点,对所述多个局部体系进行重构与赋权,确定第一概念节点; 遍历所述级联焦点,完成基于第N级联焦点的第N概念节点确定,对所述第一概念节点直至所述第N概念节点执行节点变迁下的跳视检索机制设定,生成所述动态检索链; 在所述文档数据库内进行PDF文档的动态OCR检索,包括: 将所述动态检索链写入寄存器,根据所述跳视检索机制,生成基于第一概念节点的第一检索信号; 根据所述交互线程下放所述第一检索信号,在所述文档数据库中进行一步检索,确定第一检索单列; 设定轮询检索量,当一步检索的PDF文档数量满足所述轮询检索量,整合确定所述第一检索单列; 所述寄存器依据所述动态检索链,执行检索信号的轮询生成与下放检索,直至完成第N检索单列的确定; 对所述第一检索单列直至所述第N检索单列进行整合排序,确定所述PDF检索单。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京鸿鹄云图科技股份有限公司,其通讯地址为:100080 北京市海淀区东北旺西路8号院中关村软件园23号孵化器楼405室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励