首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于向量数据库的双链应用方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州市博雅信息科技有限公司

摘要:本发明公开了一种基于向量数据库的双链应用方法,其技术方案要点是:包括以下步骤:S1、数据预处理;S2、数据标注:S3、文本向量化:S4、建立向量数据库:S5、构建双链结构:S6、信息索引化:S7、关系图展示。本专利的基于向量数据库的双链应用通过结合向量数据库的相似性搜索能力,实现了高效、准确的内容链接和关系展示。这种创新的双链应用将为数据处理和信息检索领域带来革命性的变革,满足现代数据处理对高效、准确、直观的需求。

主权项:1.一种基于向量数据库的双链应用方法,其特征在于:包括以下步骤:S1、数据预处理;S2、数据标注;S3、文本向量化;S4、建立向量数据库;S5、构建双链结构;S6、信息索引化;S7、关系图展示;所述S1中包括以下子步骤:S11、格式转换:将非结构化的文档转换为TXT格式的纯文本;S12、文档拆分:将长的文本文件,根据一定的逻辑结构进行拆分,使用的逻辑结构包括按章节、段落或根据关键词进行拆分;在拆分时使用自然语言处理技术,包括分词和命名实体识别技术;S13、数据清洗:在预处理阶段,去除文本中的无关内容,包括多余的空格、标点符号、脚注、目录;通过正则表达式或使用专门的文本清洗库来完成并确保数据的一致性和准确性;S14、数据规范化处理:对文本数据进行规范化处理,包括统一编码格式、文本对齐、去除特殊字符;所述S5中包括以下子步骤:S51、基于向量相似度分析结果,选择关联度较高的文件进行链接,构建出一个双链结构,将选定的文件通过链接关联起来;S52、根据相似度计算结果,进一步分析文本之间的关联关系,识别出主题相似、语义相近的文本,建立更准确的链接关系;S53、分析标注信息中提到的关键点、人物、事件,将关联信息整合到双链结构中,根据不同类型的标注为链接起来的文件进行关系说明,根据标注信息识别文本中的层级关系,包括利用父子关系、上下级关系构建层次化的双链结构;对文本中的实体、概念和属性进行标注;标注文本中的事件信息和事件之间的关系,包括事件触发词、参与者、时间,以在双链结构中建立事件之间的关联;利用情感分析技术对文本进行情感标注,识别文本的情感倾向,在双链结构中建立情感相关的链接,所述情感倾向包括正面、负面或中性;从文本中提取关键词,并使用关键词作为链接的标识符,将具有相似关键词的文件链接在一起;从文本中抽取实体之间的关系,包括人物关系、组织关系,并在双链结构中建立相应的链接。

全文数据:

权利要求:

百度查询: 广州市博雅信息科技有限公司 一种基于向量数据库的双链应用方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。