买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明实施例公开了一种FAQ问答对自动构建方法、装置、计算机设备及存储介质。其中,所述方法属于人工智能和自然语言处理技术领域,其包括:获取待阅读的文档;对待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档;根据待回答问题及预设的筛选模型,从目标文档中筛选出与待回答问题相匹配的段落作为目标段落;根据目标段落及待回答问题,基于预设的阅读理解模型生成FAQ问答对。本申请实施例由于是先筛选出与待回答问题相匹配的目标段落,再根据目标段落及待回答问题生成FAQ问答对,无需对非目标段落进行处理,在一定程度上减少了生成FAQ问答对时非目标段落带来的干扰信息,使生成的FAQ问答对匹配准确度更高。
主权项:1.一种FAQ问答对自动构建方法,其特征在于,包括:获取待阅读的文档;对所述待阅读的文档采用层叠CRF模型进行解析以得到XML文档;通过预设分段方式对所述XML文档进行分段,以得到具有预设文档结构的文档作为目标文档,其中,所述预设分段方式包括一级标题分段、二级标题分段以及文章段落分段;根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落,其中,所述预设的筛选模型为Bert模型;根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对;其中,所述根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对,包括:对所述目标段落及所述待回答问题分别采用预设的模型进行编码以得到第二段落文本向量及问题文本向量,其中,所述预设的模型为Bert模型和EncoderBlock模型,所述第二段落文本向量及问题文本向量为三维向量;对所述第二段落文本向量及所述问题文本向量进行编码以得到新文本向量,其中,所述新文本向量为所述三维向量,所述三维向量中的第一分量、第二分量以及第三分量分别为Batch_Size、句子长度以及每个词对应的维度;根据预设的提取模型对所述新文本向量进行编码以得到目标文本向量;对所述目标文本向量进行计算以得到所述待回答问题的答案开始及结束的位置,从而生成所述FAQ问答对;
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 FAQ问答对自动构建方法、装置、计算机设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。