买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:博云视觉(北京)科技有限公司
摘要:本发明提供一种基于大语言模型和向量数据库的非结构化数据处理系统,系统中预先设置多个大语言模型,以非结构化数据形态呈现的私域数据输入这些大语言模型,形成多个向量矩阵以向量形式对私域数据进行向量化梳理,用户的问题语句也输入至这些大语言模型各自形成查询向量,将向量矩阵与查询向量对应求取向量距离,判断模块依照向量距离筛选出终端大语言模型,并在此输入在向量距离计算过程中获取的提示向量,最终生成问题答案。本发明初始利用多个大语言模型进行后期筛选,做到了不同大语言模型之间的扬长避短,在此过程中所生成的提示向量又能确保最终答案的精确,整个系统的运行既保证结果的精确又保证运算的快速。
主权项:1.一种基于大语言模型和向量数据库的非结构化数据处理系统,其特征在于,该系统包括N种大语言模型S1、S2、…、SN、向量数据库、判断模块、执行模块,N为整数且N≥2,其中私域数据分别输入所述N种大语言模型S1、S2、…、SN从而一一对应地生成N个向量矩阵A1、A2、…AN,这N个向量矩阵A1、A2、…AN被输入至向量数据库;来自用户的问题语句分别输入所述N种大语言模型S1、S2、…、SN从而一一对应输出N个查询向量B1、B2、…BN,这N个查询向量输入至向量数据库;在向量数据库中,整数i从1依次取值至N,每个向量矩阵Ai中的所有列向量中与对应的查询向量Bi的向量距离最短的列向量设为提示向量a*i,该提示向量a*i与查询向量Bi之间的向量距离设定成向量矩阵Ai与查询向量Bi之间的向量距离Li,随着整数i从1依次取值至N,就形成了N个提示向量a*1、a*2、…、a*N和N个向量距离L1、L2、…、LN,基于所述N个提示向量a*1、a*2、…、a*N获取综合提示向量a*,判断模块在所述N个向量距离L1、L2、…、LN中求取出第k个向量距离Lk为这N个向量距离中的最小向量距离,其中,k为整数且1≤k≤N,依据k值确定所述N种大语言模型S1、S2、…、SN中的大语言模型Sk作为终端大语言模型Sk,执行模块将综合提示向量a*输入终端大语言模型Sk输出问题答案。
全文数据:
权利要求:
百度查询: 博云视觉(北京)科技有限公司 基于大语言模型和向量数据库的非结构化数据处理系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。