首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于PDF模糊查询的向量知识库构建方法及装置、设备、介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京工商大学

摘要:本申请的实施例揭示了一种基于PDF模糊查询的向量知识库构建方法及装置、设备、介质。方法包括:响应于输入的PDF文档,对所述PDF文档进行检索,在页面方向或表格方向存在异常的情况下,对存在异常的页面进行旋转处理,以在PDF文档中的所有页面的页面方向均处于设定的页面方向且不存在表格或表格中的字符方向与设定的字符方向一致的情况下,对所述PDF文档中的字符进行提取,得到用于构建向量知识库的文本数据。本申请能够更有效地处理PDF文档,并提高处理的准确性和效率。另外,本申请通过改进PDF文档的处理方法,旨在提高用户对PDF文档的使用体验,进一步促进数字化文档的交流、共享和应用,满足用户对高效、便捷文档处理的需求。

主权项:1.一种基于PDF模糊查询的向量知识库构建方法,其特征在于,所述方法包括:响应于输入的PDF文档,对所述PDF文档进行检索;在检索到所述PDF文档中的页面方向不处于设定的页面方向的情况下,确定页面所处页码,对所述页码对应的页面进行旋转,以使所述页面的页面方向与设定的页面方向一致;在检索到所述PDF文档中存在表格的情况下,对所述表格中的字符方向进行判断,若所述表格中的字符方向不处于设定的字符方向的情况下,对所述表格所处页面进行旋转,以使得所述表格中的字符方向与设定的字符方向一致;在所述PDF文档中的所有页面的页面方向均处于设定的页面方向且不存在表格或表格中的字符方向与设定的字符方向一致的情况下,对所述PDF文档中的字符进行提取,得到用于构建向量知识库的文本数据。

全文数据:

权利要求:

百度查询: 北京工商大学 基于PDF模糊查询的向量知识库构建方法及装置、设备、介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术