中山大学梁小丹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利基于ChatGPT反馈的视觉对话方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116881844B 。
龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310838570.7,技术领域涉及:G06F18/25;该发明授权基于ChatGPT反馈的视觉对话方法、装置及设备是由梁小丹;陆柳村设计研发完成,并于2023-07-07向国家知识产权局提交的专利申请。
本基于ChatGPT反馈的视觉对话方法、装置及设备在说明书摘要公布了:本发明公开了一种基于ChatGPT反馈的视觉对话方法、装置及设备,方法包括:获取目标图像、对话历史以及后续问题;提取目标图像的图像特征,提取对话历史中每轮对话回合对应的对话轮次特征;将图像特征和对话轮次特征进行特征统一;将经过特征统一后的图像特征分别与每个经过特征统一后的对话轮次特征进行拼接,得到时序特征;将目标图像、后续问题以及时序特征输入至经过预先训练的视觉对话模型,得到后续问题对应的第一预测答案;视觉对话模型根据ChatGPT对标题生成的第二预测答案训练得到,标题由目标图像和对话历史确定。本发明可以提高视觉对话的时间依赖性,可广泛应用于人工智能神经网络领域。
本发明授权基于ChatGPT反馈的视觉对话方法、装置及设备在权利要求书中公布了:1.一种基于ChatGPT反馈的视觉对话方法,其特征在于,包括: 获取目标图像、对话历史以及后续问题; 提取所述目标图像的图像特征,提取所述对话历史中每轮对话回合对应的对话轮次特征; 将所述图像特征和所述对话轮次特征进行特征统一; 将经过特征统一后的所述图像特征分别与每个经过特征统一后的所述对话轮次特征进行拼接,得到时序特征; 将所述目标图像、所述后续问题以及所述时序特征输入至经过预先训练的视觉对话模型,得到所述后续问题对应的第一预测答案;所述视觉对话模型根据ChatGPT对标题生成的第二预测答案训练得到,所述标题由所述目标图像和所述对话历史确定; 所述提取所述目标图像的图像特征,包括: 根据第一表达式提取所述目标图像的图像特征; 所述第一表达式为: , 其中,为比例因子,表示所述图像特征,σ表示非线性激活函数,表示所述目标图像的向上投影层;,表示维的实数;表示向下投影层;,表示维的实数; 所述提取所述对话历史中每轮对话回合对应的对话轮次特征,包括: 根据第二表达式提取所述对话历史中每轮对话回合对应的对话轮次特征; 所述第二表达式为: , 其中,为比例因子,表示第一对话轮次特征,σ表示非线性激活函数,表示所述第一对话轮次特征的向上投影层;,表示维的实数;表示向下投影层;,表示维的实数; 所述将所述图像特征和所述对话轮次特征进行特征统一,包括: 根据第三表达式将所述图像特征和所述对话轮次特征进行特征统一; 所述第三表达式为: , 其中,表示特征统一后的跨模态特征,表示所述跨模态特征的向上投影层; 根据第四表达式查询所述第三表达式的特征信息,第四表达式为: 其中,是输出特征,是自我注意的输出特征,是隐藏状态,包括查询特征和跨模式融合特征,是前馈网络,是层规范化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励