买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:腾讯科技(深圳)有限公司
摘要:本申请涉及计算机技术领域,提供一种多模态问答解释方法及相关装置,该方法包括:基于目标视觉内容和目标问题进行逻辑推理,生成初始答案及描述逻辑推理过程的初始解释文本,并从初始答案和初始解释文本起始进行迭代优化,获得目标答案及目标解释文本。每次迭代过程中,对本次迭代的答案及解释文本,预测得到相应的表征语义相关程度的评估值,若评估值超过设定的评估值阈值,则将本次迭代的答案及解释文本,作为目标答案及目标解释文本,否则,基于评估值和本次迭代的解释文本,再次进行逻辑推理,生成下次迭代的答案及解释文本,并进入下次迭代。通过迭代更新充分进行信息挖掘,从而有效提升问答的准确率。
主权项:1.一种多模态问答解释方法,其特征在于,包括:获取目标视觉内容和目标问题,并基于所述目标视觉内容的视觉特征和所述目标问题进行逻辑推理,生成初始答案及描述逻辑推理过程的初始解释文本;基于所述视觉特征和所述目标问题,从所述初始答案和所述初始解释文本起始进行迭代优化,获得目标答案及目标解释文本,每次迭代过程包括:基于本次迭代的答案及解释文本的语义特征,预测得到相应的评估值,所述评估值表征:同次迭代过程中产生的答案与解释文本,与所述目标视觉内容和所述目标问题之间的语义相关程度;若所述评估值超过设定的评估值阈值,则将所述本次迭代的答案及解释文本,作为所述目标答案及目标解释文本,否则,基于所述评估值和所述本次迭代的解释文本,对所述视觉特征和所述目标问题再次进行逻辑推理,生成下次迭代的答案及解释文本,并进入下次迭代。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 多模态问答解释方法及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。