恭喜成都考拉悠然科技有限公司沈复民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜成都考拉悠然科技有限公司申请的专利一种基于多模态大模型的交互方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119884691B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510352943.9,技术领域涉及:G06F18/21;该发明授权一种基于多模态大模型的交互方法、系统、设备及介质是由沈复民;张静然;申恒涛设计研发完成,并于2025-03-25向国家知识产权局提交的专利申请。
本一种基于多模态大模型的交互方法、系统、设备及介质在说明书摘要公布了:本发明提供了一种基于多模态大模型的交互方法、系统、设备及介质,涉及多模态大模型技术领域,本方法包括:获取实时输入信息集;对实时输入信息集分别进行处理,得到处理数据,处理数据包括第一处理信息、第二处理信息及第三处理信息,其中对实时视频信息进行处理得到第一处理信息,对实时音频信息进行处理得到第二处理信息,对实时文本信息进行处理得到第三处理信息;通过预设模态关联模型对处理数据进行关联计算;根据关联损失信息对处理数据进行拼接处理,得到拼接数据集;对拼接数据集进行解码输出,得到交互响应数据,交互响应数据用于反馈交互信息。本方法解决了对实时输入数据实现跨模态间的关联,方便扩展到更加复杂的多模态组合。
本发明授权一种基于多模态大模型的交互方法、系统、设备及介质在权利要求书中公布了:1.一种基于多模态大模型的交互方法,其特征在于,包括:获取实时输入信息集,所述实时输入信息集包括实时视频信息、实时音频信息和实时文本信息;对所述实时输入信息集分别进行处理,得到处理数据,所述处理数据包括第一处理信息、第二处理信息及第三处理信息,其中对所述实时视频信息进行处理得到第一处理信息,对所述实时音频信息进行处理得到第二处理信息,对所述实时文本信息进行处理得到第三处理信息;通过预设模态关联模型对处理数据进行关联计算,以获取第一处理信息、第二处理信息及第三处理信息的关联损失信息;其中,包括:获取视频文本关联的损失信息;获取音频文本关联的损失信息;根据视频文本关联的损失信息和音频文本关联的损失信息获取整体关联损失信息;其中,所述视频文本关联的损失信息的损失计算为: ;上式中,表示第一预测信息,表示预设文本的处理信息时第一处理信息的概率,表示第一处理信息,表示预设文本的处理信息,表示第二预测信息,表示预设视频的处理信息时第三处理信息的概率,表示第三处理信息,表示预设视频的处理信息,表示视频文本关联的损失信息;所述音频文本关联的损失信息的损失计算为: ;上式中,表示第三预测信息,表示预设文本的处理信息时第二处理信息的概率,表示第二处理信息,表示预设文本的处理信息,表示第四预测信息,表示预设音频的处理信息时第三处理信息的概率,表示第三处理信息,表示预设音频的处理信息,表示音频文本关联的损失信息;所述整体关联损失信息的损失计算为: ;上式中,表示整体关联损失信息,表示视频文本关联的损失信息,表示音频文本关联的损失信息,表示正则化项;根据关联损失信息对所述处理数据进行拼接处理,得到拼接数据集;当视频文本关联的损失信息、音频文本关联的损失信息以及整体关联损失信息与预设目标损失信息进行逐一比较后,均满足预设目标损失信息要求,进行拼接处理;所述预设目标损失信息要求根据大模型对不同模态的关联要求进行设定;对所述拼接数据集进行解码输出,得到交互响应数据,所述交互响应数据用于反馈交互信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都考拉悠然科技有限公司,其通讯地址为:610095 四川省成都市高新区天府五街200号4号楼A区10层1001、1002、1003室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。