一种基于概念分割的终身学习文生图方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：该发明公开了一种基于概念分割的终身学习文生图方法，属于计算机视觉领域。该方法首先构建了图片对应的包含类别的文本描述，将类别信息和图像输入到SAM中，从而把目标概念从训练图像中提取出来，再将分割后的图像输入到变分自动编码器中进行降维，然后将降维后的图像经过前向过程加噪得到和图像维度一致的噪声图像，再然后将该噪声图像作为U‑Net的输入并使用图像对应的文本描述作为概念的文本表示，目标是令网络能够预测出前向过程中所添加的真实高斯噪声，最后让加噪后的图像减去该噪声还原出原始的图像；本发明充分的发挥了概念分割的优势，有效的学习了多个不同的概念，具有良好的稳定性和泛化性，并提出了更加准确和客观的文生图模型评测方法。

主权项：1.一种基于概念分割的终身学习文生图方法，其特征在于，该方法包括：步骤1：数据集构建与预处理；获取各概念的彩色图像构造数据集；选取部分概念的图像构成子数据集；针对每个概念，构造不包含背景信息文本描述，该文本描述包含与前景图像对应的类别信息，每个概念包括多个类别；步骤2：目标概念分割；将图像和图像对应的类别描述输入到SAM模型中，SAM模型的输出是对应于概念区域的掩码m，将数据集中图像记为x，所对应的类别信息为cls，SAM模型记为，则分割过程表示如下：；其中，表示第t个概念的第k张图像，表示第t个概念的类别，表示SAM模型输出的第t个概念的第k张图像的掩码；SAM模型为一种提示型图像分割模型；利用掩码对图像进行处理，其过程如下： ;其中，表示概念分割后第t个概念的第k张图像，为超参数，将其设为255，表示概念区域以外的部分设为白色；步骤3：构建神经网络；步骤4：插入低秩适应模块；构建低秩适应模块，将A初始化为维的高斯分布矩阵，B初始化为维的零矩阵，则，从而，确保低秩模块在开始训练时不影响神经网络的参数，矩阵的秩，为预设的固定值；步骤5：构建连续学习范式；为了在预训练模型上连续学习新的概念，采用低秩适应模块存储当前概念的知识，当有新的概念到来时，冻结之前概念的低秩适应模块，同时创建一个新的低秩适应模块来学习新的概念；设预训练的U-Net的参数为，则通过低秩适应模块对模型微调后，得到的最终模型参数表达式如下：；其中，表示低秩适应模块在不同概念上学习得到的参数，表示学习第t个概念时U-Net的参数，由预训练模型的参数和低秩适应模块的参数相加得到的；同时为了模型能够根据特定的文本信息生成对应的概念图像，还需要在文本编码器中为每一个概念插入特定的标识符，每个标识符对应一个文本编码，该文本编码使用稀有的词向量初始化；步骤6：设计损失函数；在步骤1、2中数据集中图像记为x，对应的文本描述记为c，对正态分布进行随机采样得到噪声，步骤3中的变分自动编码器记为，CLIP文本编码器记为，U-Net模型记为；变分自动编码器的输入为x，输出为；z表示变分自动编码器的输出；CLIP文本编码器的输入为c，输出为，t在前向过程中随机选取，根据t的值来得到不同的，表示变分自动编码器在计算第t个概念时的输出，的计算方式如下：；其中，，表示到的乘积，为第i个前向过程变量，且，T表示概念总数；神经网络模型的L2范数损失为：；其中噪声服从标准正态分布，表示变量的数学期望，该损失的目标是最小化和的L2范数；为了增强神经网络模型学习新概念的能力，减小不同概念的参数之间的干扰，采用如下正交损失函数，该损失函数的具体形式为：；其中，I表示单位矩阵，右上标T表示转置，该损失函数的目的是让低秩适应模块的A矩阵的不同列保持正交，表示秩适应模块的第t个A矩阵，为由组成的矩阵，表示同或运算，最终得到了模型训练的损失函数：；其中为超参数，用来平衡正交损失对模型的影响；步骤7：训练总神经网络，总神经网络包括步骤3,4,5构造的神经网络；利用步骤6构建的损失函数进行神经网络训练，在实际训练过程冻结预训练的变分自动编码器、U-Net的参数，只训练添加的低秩适应模块和CLIP文本编码器的参数；最终采用训练好的总神经网络进行文生图。

全文数据：

权利要求：

百度查询：电子科技大学一种基于概念分割的终身学习文生图方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：像素补偿方法、装置、设备、显示面板及存储介质

下一篇：一种道路靶向安全警示系统、其使用方法及多个系统之间建立私有局域网的使用方法

相关技术

像素补偿方法、装置、设备、显示面板及存储介质

一种道路靶向安全警示系统、其使用方法及多个系统之间建立私有局域网的使用方法

快速滤波器校准方法

牙冠的宽度数值确定方法、装置、设备及存储介质

一种恒压输出调光电路

一种物体边沿位置的检测装置及方法

基于区域人体感应的通风柜控制方法及系统

一种组装单元体用稳态调节控制系统

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

一种汽车零部件冲压加工用夹具

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

纵置混动变速箱机械泵

学习相关技术

一种学习书架_刘毅_202420259449.9

提升AI识别学习能力_华为技术有限公司_201980068228.5

基于关键学习期识别的同态加密联邦学习通信成本控制方法和系统_北京航空航天大学_202410766229.X

一种基于原型对齐学习的个性化联邦学习方法_浙江大学_202410762046.0

一种基于联邦学习的机器学习模型训练方法及装置_西交网络空间安全研究院_202410880422.6

一种基于学习行为的个性化区块链联邦学习方法_东华大学_202410792742.6

基于深度学习的自动束建模_医科达(上海)科技有限公司_202080103747.3

一种学习桌_厦门胜诚鑫科技股份有限公司_202323419230.5

一种面向深度学习大模型的参数微调迁移学习方法及系统_山东省计算中心(国家超级计算济南中心)_202410820143.0

检查装置、检查方法、学习完毕模型生成装置、检查用程序以及学习完毕模型生成用程序_日置电机株式会社_202380020782.2

文生图相关技术

结合频谱以及空间图结构的图对比学习方法及系统_武汉大学_202410569439.X

一种关键点图建图方法、装置和电子设备_深圳一清创新科技有限公司_202111599121.9

图节点关系表征生成和图节点业务关系预测方法及装置_支付宝(杭州)信息技术有限公司_202111003074.7

智能配图方法和装置_北京京东尚科信息技术有限公司_201910968256.4

树状网络图产生方法_蓝星球资讯股份有限公司_202310264477.X

一种基于二维图分数阶傅里叶变换的图数据压缩方法_北京理工大学_202210164760.0

一种审图用的展示装置_佛山德顺施工图审查有限公司_202323498347.7

一种水电站调度图绘制方法_上海勘测设计研究院有限公司_202410795114.3

二部图的简化图形描绘的方法和系统_罗伯特·博世有限公司_201980029234.X

一种林格曼黑度图测量校准设备_山东省计量科学研究院_202323034751.9

分割相关技术

多功能木板分割机_四川省工帮新型建材有限公司_202323361856.5

建筑物点云数据分割、点云数据语义分割方法及系统_重庆市测绘科学技术研究院_202310713896.7

遥感图像语义分割模型构建方法、分割方法、装置、设备和介质_北京邮电大学_202410701367.X

包覆机快速分割刀具_山东吉布斯新材料有限公司_202420221268.7

一种基于分割万物模型和前融合的指令分割方法和装置_华中科技大学_202410822470.X

一种医学图像的分割方法和系统_上海联影智能医疗科技有限公司_202410817556.3

基于ACKU-Net的腹部淋巴区域分割方法_长春理工大学_202410681815.4

一种遥感图像精确分割方法_南京信息工程大学_202410956611.7

一种肿瘤区域微血管分割方法、装置_杭州迪英加科技有限公司_202111030762.2

一种基于时空编码的资产分割方法_安徽星河云创数字科技有限公司_202410412567.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于概念分割的终身学习文生图方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务