江西财经大学刘学林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西财经大学申请的专利基于视觉语言对应的AI生成全景图像质量评价方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119919423B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510425337.5,技术领域涉及:G06F40/30;该发明授权基于视觉语言对应的AI生成全景图像质量评价方法与系统是由刘学林;赖晨毅;鄢杰斌;李阳;方玉明设计研发完成,并于2025-04-07向国家知识产权局提交的专利申请。
本基于视觉语言对应的AI生成全景图像质量评价方法与系统在说明书摘要公布了:本发明提出一种基于视觉语言对应的AI生成全景图像质量评价方法与系统,该方法包括:获取AI生成全景图像,对AI生成全景图像进行采样;基于图像块集合,利用视觉编码器对图像块进行特征表示;利用语言编码器对AI生成全景图像附有的文本描述进行特征表示;对图像块的视觉特征与文本描述的文本特征依次进行L2归一化处理和余弦相似度计算;利用全连接网络和归一化函数对融合后的特征向量进行处理。本发明使用视觉语言对应分析,对AI生成全景图像以及其相对应的文本描述,两者联动分析,利用学习到的视觉语言对应关系,高效准确预测AI生成全景图像的质量分数。
本发明授权基于视觉语言对应的AI生成全景图像质量评价方法与系统在权利要求书中公布了:1.一种基于视觉语言对应的AI生成全景图像质量评价方法,其特征在于,所述方法包括如下步骤: 步骤1、基于Transformer架构构建视觉编码器和语言编码器,基于特征融合机制构建多模态特征融合模块,语言编码器、视觉编码器和多模态特征融合模块构成质量评价模型; 步骤2、获取AI生成全景图像,对AI生成全景图像进行采样以得到图像块集合; 步骤3、基于图像块集合,利用视觉编码器对图像块进行特征表示以得到图像块的视觉特征; 步骤4、利用语言编码器对AI生成全景图像附有的文本描述进行特征表示,以得到文本描述的文本特征; 步骤5、对图像块的视觉特征与文本描述的文本特征依次进行L2归一化处理和余弦相似度计算,以得到融合后的特征向量; 步骤6、利用全连接网络和归一化函数对融合后的特征向量进行处理,以得到预测质量分数; 基于预测质量分数构建平均绝对误差损失和皮尔逊相关诱导损失,利用平均绝对误差损失和皮尔逊相关诱导损失对质量评价模型进行优化,得到优化后的质量评价模型; 利用优化后的质量评价模型获取评价结果; 其中,在所述步骤4中,利用语言编码器对AI生成全景图像附有的文本描述进行特征表示,以得到文本描述的文本特征,具体包括如下子步骤: 将AI生成全景图像附有的文本描述进行分解,以得到个token; 利用嵌入矩阵将token映射到高维空间,以得到词向量; 对词向量进行位置编码的配置以构建得到位置编码矩阵,利用位置编码矩阵对词向量进行嵌入操作,以得到融合位置编码的词向量; 对融合位置编码的词向量进行整合,以得到融合位置编码的输入序列; 将融合位置编码的输入序列输入至Transformer编码器中进行层编码处理,以得到特征序列; 利用可训练投影矩阵对特征序列进行处理,以得到文本特征; 将AI生成全景图像附有的文本描述进行分解,以得到个token,对应过程中存在如下关系式, ; 其中,表示AI生成全景图像附有的文本描述,token表示文本处理单元,表示token的总数,均表示token; 在利用嵌入矩阵将token映射到高维空间,以得到词向量的步骤中,对应过程中存在如下关系式: ; 其中,表示嵌入矩阵,表示嵌入矩阵运算,表示第个token,表示第个token对应的词向量,表示token的索引; 在对词向量进行位置编码的配置以构建得到位置编码矩阵,利用位置编码矩阵对词向量进行嵌入操作,以得到融合位置编码的词向量的步骤中,对应过程中存在如下关系式: ; 其中,表示融合位置编码的第个token对应的词向量,表示第个token对应的位置编码; 在对融合位置编码的词向量进行整合,以得到融合位置编码的输入序列的步骤中,对应过程中存在如下关系式; ; 其中,表示融合位置编码的输入序列,均表示融合位置编码的词向量; 在将融合位置编码的输入序列输入至Transformer编码器中进行层编码处理,以得到特征序列,对应过程中存在如下关系式: ; 其中,表示经过层Transformer编码器处理后的特征序列,表示参数为的Transformer特征编码器; 在利用可训练投影矩阵对特征序列进行处理,以得到文本特征的步骤中,对应过程中存在如下关系式: ; 其中,表示文本特征,表示因果掩码矩阵,表示可训练投影矩阵; 其中,在所述步骤6中,利用全连接网络和归一化函数对融合后的特征向量进行处理,以得到预测质量分数,具体包括如下子步骤: 利用全连接网络对融合后的特征向量进行处理,以得到输出得分,对应过程中存在如下关系式: ; 其中,表示融合后的特征向量经过全连接层后的输出得分,表示全连接层的权重矩阵,表示融合后的特征向量,表示偏置项; 利用归一化函数对融合后的特征向量经过全连接层后的输出得分进行归一化处理,以得到预测质量分数,对应过程中存在如下关系式: ; 其中,表示预测质量分数,表示经过一般归一化方式处理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西财经大学,其通讯地址为:330000 江西省南昌市经济技术开发区双港东大街169号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。