恭喜杭州瑞欧科技有限公司朱海东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州瑞欧科技有限公司申请的专利一种结合ElasticSearch和AI的搜索问答方法及其系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119474326B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510060927.2,技术领域涉及:G06F16/3329;该发明授权一种结合ElasticSearch和AI的搜索问答方法及其系统是由朱海东;肖凤生;张沫;付颖颖;李莉;罗井荣设计研发完成,并于2025-01-15向国家知识产权局提交的专利申请。
本一种结合ElasticSearch和AI的搜索问答方法及其系统在说明书摘要公布了:本发明涉及数据搜索技术领域,具体公开了一种结合ElasticSearch和AI的搜索问答方法。包括:将问题进行预先分类,接着获取用户输入的问题,对问题进行预处理,得到问题文本特征数据,再对问题文本特征数据进行计算,得到问题分类值,并判断问题分类值是否处于预设阈值区间内,并对分类之后的问题进行分类处理以回答用户问题,本发明能够利用BERT模型及其内部神经网络结构计算问题分类概率并确定最终分类结果,相对于RAG技术中相对简单的问题分类方式具有明显优势,RAG技术在分类时无法充分考虑问题的深层次语义关系,导致分类不准确,进而会出现难以回答或者答非所问的现象,可以有效提高用户体验,提高用户粘性。
本发明授权一种结合ElasticSearch和AI的搜索问答方法及其系统在权利要求书中公布了:1.一种结合ElasticSearch和AI的搜索问答方法,其特征在于,包括:将问题进行预先分类,其中问题类型分为:关于网站基本信息的问题a、与网站内容相关的问题b以及通用问题c;获取用户输入的问题文本,并对所述问题文本进行预处理,得到处理问题文本;对处理问题文本进行特征提取,得到问题文本特征数据;所述对处理问题文本进行特征提取,得到问题文本特征数据的步骤包括:将用户输入问题的转化为one-hot编码向量;假设输入问题经过分词和去除停用词后为n个单词,表示第i个单词,i=1,2,……n,index()表示单词在词表中的索引,则生成的one-hot编码向量v的计算公式为: 其中j=0,1,2……,k-1,表示问题文本特征数据;基于BERT模型和神经网络结构对问题文本特征数据进行计算,得到问题分类值,并判断问题分类值是否处于预设阈值区间内;其中,经过前面的预处理步骤,问题已被转化为模型可处理的格式,其中,将向量形状设为[序列长度L,词向量维度d];问题分类值的计算公式为: ;其中,S为问题分类值;对用户输入的问题所属的类型进行判断;若,则最终分类结果为关于网站基本信息的问题a;若,则最终分类结果为网站内容相关的问题b;若,则最终分类结果为通用问题c;若问题分类值处于预设阈值区间内,将其划分到网站内容相关的问题b;若问题分类值大于预设阈值区间最大值,将其划分到网站基本信息的问题a;若问题分类值小于预设阈值区间最小值,将其划分到通用问题c;对分类之后的问题类型进行分类处理以回答用户问题;其中,对于类别a,首先将问题与预设的信息库中的问题模板或关键词进行匹配;接着,使用LLM根据检索到的预设网站信息生成回答;最后,将生成的回答输出给用户;对于类别c,首先,在历史聊天记录数据库中进行检索;接着,对检索到的聊天记录进行筛选,优先选择近期的、与当前用户特征相似的用户的聊天记录,并生成预回答内容;根据所述预回答内容,对预回答进行自检,判断是否存在错误内容;若存在错误内容,则对错误内容进行纠正,并生成修订回答内容,再将修订回答内容输出给用户;若不存在错误内容,则直接将预回答内容输出给用户。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州瑞欧科技有限公司,其通讯地址为:310000 浙江省杭州市余杭区仓前街道仓兴街397号6幢2单元101室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。