买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供了基于大模型与多存储技术的素材提取和生成方法,属于素材提取生成技术领域。方法采用对象数据库、向量数据库和知识图谱存储收集到的素材原始资料;当用户输入文本时,分别从对象数据库、向量数据库和知识图谱获取相关资料,实现资料的全文精准匹配、语义相似度检索和关系深度挖掘;针对获取到的资料分别计算文本相似度和语义相似度;将获取到的资料输入大语言模型生成相应素材,并利用评分模型对生成的素材进行评分;综合考虑文本相似度、语义相似度和评分计算每个素材的多目标优化值;根据多目标优化值对生成的素材进行排序,取排名最高的作为最终生成的素材。本发明生成的素材安全可控,且风格统一,更符合用户偏好。
主权项:1.一种基于大模型与多存储技术的素材提取和生成方法,其特征在于,包括:获取素材原始资料并进行资料预处理,将预处理后的素材原始资料存储至对象数据库;依据预处理后的素材原始资料构建向量数据库,同时利用预处理后的素材原始资料构建素材知识图谱,并将素材知识图谱存储至图数据库;根据预设敏感词表对用户的输入文本进行敏感词过滤,得到过滤后的输入文本;依据过滤后的输入文本在所述对象数据库、向量数据库和图数据库中进行检索,分别得到第一检索结果、第二检索结果和第三检索结果;分别将第一检索结果、第二检索结果和第三检索结果与过滤后的输入文本进行相似度计算,获得文本相似度值Simt和语义相似度值Simv;将过滤后的输入文本、第一检索结果、第二检索结果和第三检索结果拼接后输入第一大语言模型,生成个性化素材,并将个性化素材输入第二大模型进行评分,得到素材的评分值Sco;基于文本相似度值Simt、语义相似度值Simv和素材的评分值Sco计算出每个个性化素材的多优化目标值Obj;对每个个性化素材的多优化目标值Obj进行排序,取排名为前k个的素材作为最终生成的素材。
全文数据:
权利要求:
百度查询: 成都国智未来科技有限公司 基于大模型与多存储技术的素材提取和生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。