恭喜杭州电子科技大学乔通获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州电子科技大学申请的专利一种基于视觉语言模型的生成式图像无监督检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118552756B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410332649.7,技术领域涉及:G06V10/762;该发明授权一种基于视觉语言模型的生成式图像无监督检测方法是由乔通;邵杭;章国道;周晓飞;沈张一设计研发完成,并于2024-03-22向国家知识产权局提交的专利申请。
本一种基于视觉语言模型的生成式图像无监督检测方法在说明书摘要公布了:本发明公开了一种基于视觉语言模型的生成式图像无监督检测方法,包括如下步骤:获取图像数据集;通过噪声指纹提取、频域特征提取和聚类算法,为未标记数据有效分配噪声标签,并利用预训练的视觉语言模型和对比学习策略,建立了一个高效的特征提取器;使用训练好的特征提取器提取待测试样本的高维度判别特征,并通过聚类算法将得到的判别特征归为两个聚类簇,通过计算余弦相似度判别真实图像和生成图像。该方法通过无监督学习,自始至终都不需要使用标记数据,克服了有监督学习依赖正确标记的大规模数据的问题。并通过预训练的视觉语言模型提升检测器的泛化性和鲁棒性。在检测不同生成模型生成的图像时展现了一定的泛化能力。
本发明授权一种基于视觉语言模型的生成式图像无监督检测方法在权利要求书中公布了:1.一种基于视觉语言模型的生成式图像无监督检测方法,其特征在于,包括如下步骤:步骤1、获取图像数据集;步骤2、特征提取器训练步骤2-1、噪声指纹提取,输入图像数据集使用去噪滤波器从图像中提取噪声指纹;步骤2-2、频域特征提取,首先使用离散傅里叶变换将得到的噪声指纹转换至频域中,随后将得到的频域矩阵展平以作为频域特征;步骤2-3、噪声标签分配,通过聚类算法将提取的频域特征分成两个聚类簇,随后给两个聚类簇随机分配噪声标签;步骤2-4、将分配有噪声标签的聚类簇进行数据增广;步骤2-5、使用预训练的视觉语言模型CLIP作为特征提取主干网络,将数据增广后的图像数据作为输入并通过对比损失函数进行训练;所述特征提取器的训练方法为:首先将增广后的图像输入CLIP网络以获得高维度特征,随即对其进行归一化操作,然后通过投影头将其投影到低维空间,通过对比损失函数最小化具有相同噪声标签的样本之间的距离,同时最大化具有不同噪声标签的样本之间的距离,对比损失函数定义如下: 其中集合I={1,...,2N}表示经过数据增广后得到的所有样本,i是集合I中的一个样本,集合Pi={1,...,M}表示集合I中与i具有相同噪声标签的样本,集合Ai={1,...,K}表示集合I中去除i后剩余的样本,h表示特征提取网络输出的特征,·表示内积,τ表示温度参数步骤3、二元分类器使用训练好的特征提取器提取待测试样本的高维度判别特征,并通过聚类算法将得到的判别特征归为两个聚类簇,通过计算余弦相似度判别真实图像和生成图像,余弦相似度计算方法为: 其中x,x表示同一聚类簇中的一对不同图像,分别对两个聚类簇所属样本计算余弦相似度,随后计算每个聚类簇的平均余弦相似度,将两个聚类簇的平均余弦相似度进行比较,具有较高平均余弦相似度的图像聚类簇被认为是生成图像,平均余弦相似度较低的图像聚类簇被认为是真实图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。