Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安电子科技大学;西安电子科技大学杭州研究院高飞获国家专利权

西安电子科技大学;西安电子科技大学杭州研究院高飞获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安电子科技大学;西安电子科技大学杭州研究院申请的专利一种基于状态空间模型的通用图像美学评价方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118822992B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410927851.4,技术领域涉及:G06F40/284;该发明授权一种基于状态空间模型的通用图像美学评价方法是由高飞;史嘉琦;何立火;王楠楠设计研发完成,并于2024-07-11向国家知识产权局提交的专利申请。

一种基于状态空间模型的通用图像美学评价方法在说明书摘要公布了:本发明公开了一种基于状态空间模型的通用图像美学评价方法,包括以下步骤;步骤1,根据数据集和任务类型,获取训练样本集Strain和测试集Stest;步骤2,构建通用图像美学评价框架的子模块:步骤3:从步骤2中不同的子模块进行构建,结合具体任务构建具体通用性或者个性化美学评价模型M;步骤4,对网络模型M进行迭代训练:步骤5,通过步骤4迭代训练后的模型。获取美学质量评价分数预测结果。本发明有效的解决了现有图像美学评价模型难以结合局部和全局图像特征、模型多任务训练的不平衡性、模型难以高效灵活设计的问题。

本发明授权一种基于状态空间模型的通用图像美学评价方法在权利要求书中公布了:1.一种基于状态空间模型的通用图像美学评价方法,其特征在于,包括以下步骤; 步骤1,根据数据集和任务类型,获取训练样本集Strain和测试集Stest; 步骤2,构建通用图像美学评价框架的子模块: 步骤3:从步骤2中不同的子模块进行构建,结合具体任务构建具体通用性或者个性化美学评价模型M; 步骤4,对网络模型M进行迭代训练: 步骤5,通过步骤4迭代训练后的模型,获取美学质量评价分数预测结果; 所述步骤2具体为: 步骤1.基于SSM的视觉编码器Ev,采用Vmamba-Tiny作为骨干网络,在模型的分类头输出层之后得到输出的图像特征,对输出特征采取平均值池化; 步骤2.用户信息的文本编码器Et,首先利用WordPieceTokenizer,WPT对输入的评论进行精细化的分词处理,生成一个长度为n的单词序列,然后在序列的起始位置添加一个特殊标记[cls],以表示全局特征,为其添加相应的位置编码,并通过线性映射将其转换为嵌入向量,这些嵌入向量随后被输入到一个包含12个Transformer模块的模型中,最终输出序列长度维度n可变的向量,n代表单词长度,截取输出的第0维度的特征cls作为输出; 步骤3.自适应平均池化AAP,通过平均池化将输入的序列维度压缩至1维; 步骤4.跨信息融合模块CMF,利用图像和文本编码器中分别提取的视觉特征fv和文本特征ft; 步骤5.特征适配器,首先接收特征f,对于特定的第i个任务来说,将f进行非线性映射降低维度,经过GELU激活函数之后映射回到接收时维度的特征,与之前的图像特征进行残差连接得到输出特征将多尺度适配器称作全局分支; 步骤6.任务适配器:在特征适配器的基础上加入若干局部分支构成任务适配器; 所述步骤3具体为: 模型接收三种类型的输入,分别是图像,图像描述文本信息以及用户信息;根据具体任务的不同,模型将会采取不同的构造方式搭建;根据预测属性的不同,模型又会采用不同的适配器; 具体的模型选择: AesMmba-V模型:开展纯视觉美学评价任务VIAA,输入为图片,输出为美学分数,采用图像编码器Ev,单个全局分支和若干局部分支; AesMmba-M模型:开展视觉文本融合的美学评价任务MIAA,输入为图片和图像描述相关文本信息,输出为美学分数,采用图像编码器Ev,文本编码器Et,信息融合模块CMF,单个全局分支和若干局部分支; AesMmba-F模型:开展纯视觉细粒度图像美学评价任务FIAA,输入为图片,需要预测多个属性的分数,则采用图像编码器Ev,多个全局分支和若干局部分支; AesMmba-P模型:开展个性化视觉美学评价任务PIAA,输入为图片和用户描述信息,采用图像编码器Ev,文本编码器Et,信息融合模块CMF,多个全局分支和若干局部分支; 其中,全局分支的数量i取决于数据集属性的个数,局部分支的类型和取决于单属性分数的类型,分布型或者平均值型,开展不同的美学评价任务,按上述方式构建模型M; 所述步骤4具体为: 步骤4.1,训练阶段初始化模型; 初始化迭代次数为t,最大迭代次数为T,针对步骤3种选择的不同模型,设当前基于多粒度网络的无参考图像质量评价网络模型为Mt,M为开展VIAA任务的模型,初始化令t=1,Mt=M; 步骤4.2,训练阶段,设置从训练样本集Strain中不放回地随机选取batch_size个训练样本作为网络模型Mt的输入; 步骤4.3,构建损失函数:损失函数共有三种: 均方误差损失函数:其中代表预测分数,si代表真实分数,n表示样本数量; 平衡交叉熵损失函数:其中nl代表l实例数量,Ci代表类别标签,K表示任务数量; 全局移动距离损失函数: 其中a是预测标签,p是数据集的正确标签,CDF是组合分布函数,Len是区间块数量,在推理阶段,根据预测的分布来计算美学评估得分; 对于不同的数据集,需要开展不同的训练策略:AVA和Photo.Net包括每幅图像的美学得分分布的数据集采用Ldst开展分布损失,对于AADB,PARA包含真实分数的数据集采用Lreg进行回归损失。 Ldst=LEMD+γLMSE+λLBa1-CE, Lreg=LMSE+λLBa1-CE, 对于首先计算每个训练样本对应的预测分数与该训练样本对应的分数标签,按照数据集的不同计算上述损失函数。对网络模型St的各层权值参数进行更新; 步骤4.4,判断是否已遍历训练样本集Strain,若是,执行步骤4.5,否则,执行步骤4.2和4.3; 步骤4.5,判断t=T是否成立,若是,得到训练好的基于多粒度网络的无参考图像质量评价网络模型M*=Mt,否则,令t=t+1,并执行步骤4.3和4.4; 所述步骤5具体为: 将测试样本集Stest作为训练完成的网络模型M*的输入进行前向推理,得到每个测试样本的质量预测分数,对于回归预测的数据集,预测输出为分数回归分支输出;对于分布预测的数据集,预测输出为分布预测输出的加权组合,对于PIAA任务,则对Mi进行前向推理,最终评价指标取平均值,以验证模型效果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学;西安电子科技大学杭州研究院,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。