基于知识增强的视觉问答方法及平台

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明提供一种基于知识增强的视觉问答方法及平台，属于人工智能技术领域，其中方法包括：获取用户输入的图像和问题文本，得到输入文本；将输入文本输入至视觉问答模型的检索器，得到多个相关外部知识；将多个相关外部知识分别与输入文本拼接，得到多个拼接后的输入文本，将多个拼接后的输入文本输入至视觉问答模型的答案生成器，得到每一拼接后的输入文本对应的答案文本，将输入文本输入至答案生成器，得到输入文本对应的答案文本，确定输入文本对应的最终的目标答案文本；其中，视觉问答模型是对初始视觉问答模型的初始答案生成器和初始检索器进行联合训练得到的。本发明能够合理利用检索到的外部知识和视觉问答模型自身隐含的内部知识。

主权项：1.一种基于知识增强的视觉问答方法，其特征在于，应用于基于知识增强的视觉问答平台，包括：获取用户输入的图像和问题文本，对所述图像和问题文本进行处理，得到输入文本；将所述输入文本输入至预先构建的视觉问答模型的检索器，得到所述检索器输出的所述输入文本对应的多个相关外部知识；将所述多个相关外部知识分别与所述输入文本拼接，得到多个拼接后的输入文本，将所述多个拼接后的输入文本输入至所述视觉问答模型的答案生成器，得到所述答案生成器输出的每一拼接后的输入文本对应的答案文本，将所述输入文本输入至所述答案生成器，得到所述答案生成器输出的所述输入文本对应的答案文本；从所述每一拼接后的输入文本对应的答案文本和所述输入文本对应的答案文本中确定所述输入文本对应的最终的目标答案文本；其中，所述视觉问答模型是以样本输入文本为训练样本，以所述样本输入文本对应的答案文本标签为样本标签，对初始视觉问答模型的初始答案生成器和初始检索器进行联合训练得到的；所述视觉问答模型的确定过程，包括：获取样本图像和样本问题文本，对所述样本图像和样本问题文本进行处理，得到样本输入文本，确定所述样本输入文本对应的答案文本标签；将所述样本输入文本输入至所述初始视觉问答模型的初始检索器，得到所述初始检索器输出的所述样本输入文本对应的多个样本相关外部知识；将所述多个样本相关外部知识分别与所述样本输入文本拼接，得到多个拼接后的样本输入文本，将所述多个拼接后的样本输入文本输入至所述初始视觉问答模型的初始答案生成器，得到所述初始答案生成器输出的每一拼接后的样本输入文本对应的答案文本预测结果，将所述样本输入文本输入至所述初始答案生成器，得到所述初始答案生成器输出的所述样本输入文本对应的答案文本预测结果；从所述每一拼接后的样本输入文本对应的答案文本预测结果和所述样本输入文本对应的答案文本预测结果中确定所述样本输入文本对应的最终的目标答案文本；基于所述每一拼接后的样本输入文本对应的答案文本预测结果和所述样本输入文本对应的答案文本预测结果，以及所述样本输入文本对应的答案文本标签，计算优化目标函数值；基于所述优化目标函数值，训练所述初始视觉问答模型，对所述初始视觉问答模型进行参数优化迭代，得到所述视觉问答模型；其中，所述检索器的确定过程包括：基于所述样本输入文本对应的答案文本标签，将所述多个拼接后的样本输入文本对应的答案文本预测结果和所述样本输入文本对应的答案文本预测结果进行比较，得到比较结果；基于所述比较结果，得到监督训练信号，对所述初始检索器进行训练，在所述初始检索器训练完成后，得到所述检索器。

全文数据：

权利要求：

百度查询：中国科学院自动化研究所基于知识增强的视觉问答方法及平台

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：柴油发电机并网管控半物理测试系统与方法

下一篇：一种SAP与其他系统的通用接口集成方法

相关技术

柴油发电机并网管控半物理测试系统与方法

一种SAP与其他系统的通用接口集成方法

一种基于RTDETR的半监督学习的电力设备状态识别方法及系统

一种甲烷二磺酸亚甲酯的制备方法

退役核设施结构安全评估可靠度方法及系统

静脉血栓栓塞症相关SNP位点检测引物组及试剂盒

用于舆情热度预测的轻量集成模型系统及其训练方法

一种任务执行方法、装置、存储介质及电子设备

一种基于FPGA的片上异构DDR总线控制单元

一种降低针叶材化机浆废水中树脂酸含量的方法

一种基于地形扫描的定深度型播种机及播种方法

一种基于域控模块的单节点电源管理方法及系统

视觉相关技术

视觉相机移动平台_深圳九州光电子技术有限公司_202420196900.7

一种结合视觉反馈曲线的双目视觉感知障碍评级系统_天津菁视科技有限公司_202410961345.7

基于视觉问答的盲人智能视觉辅助方法和系统_河海大学_202410942598.X

基于因果引导视觉注意力表征视觉问答方法、介质及设备_合肥工业大学_202411310645.5

视觉模块模拟测试装置_安徽博清机器人科技有限公司_202420607789.6

一种视觉检测设备_惠州市恒轩五金制品有限公司_202420007604.8

一种视觉检测系统_深圳市本多自动化科技有限公司_202411007711.1

一种木板缺陷视觉检测装置_南宁华数轻量化电动汽车设计院有限公司_202010749067.0

一种视觉传达设计图纸收纳装置_西安工业大学_202420912681.8

计算机生成渲染环境的视觉搜索细化_苹果公司_202411081178.3

问答相关技术

问答方法、设备以及存储介质_浙江大华技术股份有限公司_202411200806.5

数据问答系统及其调用方法_中科先进(深圳)集成技术有限公司_202411519026.7

问答方法、电子设备以及存储介质_浙江大华技术股份有限公司_202411200818.8

长文档视觉问答方法、装置及电子设备_中国科学院自动化研究所_202411526272.5

一种用于知识问答的数据处理方法、装置、介质及设备_浙江有数数智科技有限公司_202411189092.2

检索增强生成式问答的输出方法、装置、设备及存储介质_中国平安财产保险股份有限公司_202411187876.1

知识问答方法、装置、电子设备、产品及存储介质_中国移动通信集团设计院有限公司_202411086620.1

一种交互式法律问答的历史案例检索方法_贵州大学_202411280929.4

智能问答方法、系统、电子设备及可读存储介质_中移信息系统集成有限公司_202411522558.6

基于元数据特征和思维链的多表关联大语言模型问答方法_中国电子科技集团公司第十五研究所_202410687924.7

方法相关技术

图像重建方法、训练方法、检测方法、装置和存储介质_浙江大华技术股份有限公司_202111165805.8

挡片及其制备方法、刻蚀终点的确认方法和循环使用方法_粤芯半导体技术股份有限公司_202411167504.2

文本识别方法、拼写纠错方法及语音识别方法_阿里巴巴集团控股有限公司_201910632996.0

描绘数据检查方法、描绘方法、描绘装置以及程序_纽富来科技股份有限公司_202410669422.1

位置确定方法、闸机控制方法及装置_北京城建智控科技股份有限公司_202411519593.2

像素电路及其驱动方法、阵列基板及其测试方法_合肥维信诺科技有限公司_202411358337.X

电极、制造电极的方法及分离装置和方法_广东栗子科技有限公司_202010183572.3

动画处理方法和动画校验方法_腾讯科技(深圳)有限公司_201910503023.7

外延生长方法、尺寸补偿方法及形成掩膜图案的方法_北京北方华创微电子装备有限公司_202310622848.7

灯具及其控制方法_广州彩熠灯光股份有限公司_202411324015.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于知识增强的视觉问答方法及平台

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务