中国科学院自动化研究所徐常胜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利视觉问答方法、装置、电子设备、存储介质和计算机程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120146205B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510621772.5,技术领域涉及:G06N5/045;该发明授权视觉问答方法、装置、电子设备、存储介质和计算机程序产品是由徐常胜;钱胜胜;周祖漪设计研发完成,并于2025-05-14向国家知识产权局提交的专利申请。
本视觉问答方法、装置、电子设备、存储介质和计算机程序产品在说明书摘要公布了:本公开关于视觉问答方法、装置、电子设备、存储介质和计算机程序产品,该方法包括:获取目标图像以及针对目标图像的目标问题;基于目标问题,生成初始程序;向初始程序添加用于记录程序执行过程的目标代码;将目标图像输入扩展程序,获得针对目标问题的预测答案、扩展程序的执行过程信息以及截图图像;基于执行过程信息和截图图像,生成针对预测答案的多模态形式的解释。这样,可以在输出预测答案的同时同步生成决策依据图片以及语义关联分析,即可以增加输出对预测答案的推理过程的解释,使用户能够直观地了解图像特征与语义推理的对应关系,进而可以提升推理透明度和决策可信度,从而有利于视觉问答技术的推广应用。
本发明授权视觉问答方法、装置、电子设备、存储介质和计算机程序产品在权利要求书中公布了:1.一种视觉问答方法,其特征在于,包括: 获取目标图像以及针对所述目标图像的目标问题; 基于所述目标问题,生成初始程序,其中,所述初始程序用于执行推理以获得所述目标问题的答案; 向所述初始程序添加用于记录程序执行过程的目标代码,获得扩展程序; 将所述目标图像输入所述扩展程序,获得针对所述目标问题的预测答案、所述扩展程序的执行过程信息以及截图图像,其中,所述截图图像为与所述目标问题所指向的目标对象相关联的、且从所述目标图像中截取获得的截图图像; 基于所述执行过程信息和所述截图图像,生成针对所述预测答案的多模态形式的解释,其中,所述多模态形式至少融合有文本形式和图像形式; 其中,所述基于所述目标问题,生成初始程序,包括: 获取预设的程序提示,其中,所述预设的程序提示包含结构思维链构筑方法和程序提示示例,所述结构思维链构筑方法用于指示如何基于问题构筑相应的结构思维链,所述程序提示示例用于指示如何基于结构思维链生成相应的程序,所述预设的程序提示为单样本程序提示; 基于所述结构思维链构筑方法,构筑所述目标问题对应的目标结构思维链; 基于所述程序提示示例,生成所述目标结构思维链对应的所述初始程序。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。