Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜杭州电子科技大学陈鼎获国家专利权

恭喜杭州电子科技大学陈鼎获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜杭州电子科技大学申请的专利一种基于适配网络增强扩散模型的人体姿态场景恢复方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117392675B

龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311293866.1,技术领域涉及:G06V20/70;该发明授权一种基于适配网络增强扩散模型的人体姿态场景恢复方法是由陈鼎;王可逸;余宙;俞俊设计研发完成,并于2023-10-09向国家知识产权局提交的专利申请。

一种基于适配网络增强扩散模型的人体姿态场景恢复方法在说明书摘要公布了:本发明公开了一种基于适配网络增强扩散模型的人体姿态场景恢复方法,属于计算机视觉的图像生成领域,该方法首先每一组训练用的数据表示为一个五元组AN,BN,y,ZA,ZB,并用点阵AN,BN分别制作灰度图A0,B0。其次由扩散模型得到扩散模型中主副适配器的差异,并根据差异计算出损失函数,并计算结余损失。最后根据损失函数和结余损失函数得到全局优化函数,对输出的人物姿态图进行优化。本发明消除了通过试探方法训练寻找损失函数间权值时所需的计算开销,实现了预训练模型功能细分的训练方式,使得输出的人物姿态图更为准确稳定。

本发明授权一种基于适配网络增强扩散模型的人体姿态场景恢复方法在权利要求书中公布了:1.一种基于适配网络增强扩散模型的人体姿态场景恢复方法,其特征在于,包括以下步骤:步骤1.每一组训练用的数据表示为一个五元组AN,BN,y,ZA,ZB,其中y为文本描述标注,AN,BN是两个元素个数均为的点阵,为图像数据,其中数字3意味着图像按照RGB格式存储,w,h分别表示图像的宽度和高度;用Ψδ·表示输入图像产生图像中人物关节基点坐标点点集的模型,以δ为权重;根据图像ZA,ZB分别得到的点阵AN,BN;步骤2.用点阵AN,BN分别制作灰度图A0,B0;步骤3.由扩散模型得到扩散模型中主副适配器的差异,并根据差异计算出损失函数,并计算结余损失;具体过程如下:3.1.将扩散模型的推理过程描述为: 上式中且αt∈[0,1]为扩散模型中的可调参数;扩散模型中,时间步骤t遍历T,T-1,…,2,1,共T个等式,式中∈θ为扩散模型中预训练的U-Net模型,以θ为权重;表示去噪过程在第t步采样得到生成图像在隐空间中的表示,且在t=T时取表示服从各维度均值均为0,协方差矩阵为单位矩阵I,即一个高维正态分布;3.2.将扩散模型中的隐空间图像表示解码成真实图片,使用变分自编码器的解码器,记为De·,t时的真实图像Zt表示为: 在使用适配器的扩散模型的去噪过程中,隐空间中的图像表示为: 其中X0表示图像条件输入,y表示文本输入,FΦ表示以Φ为权重的适配器模型;在上述扩散模型中,分别将灰度图A0传入主适配器获得向量将灰度图B0传入副适配器获得向量分别按照T2I-Adapter模型中的方法注入到扩散模型中,Φ1,Φ2分别表示适配器模型使用的权重;3.3.扩散模型使用U-Net作为去噪网络,并使用对比语言图像预训练CLIP作为将文本内容转化为向量的编码器,使用免类别指引;将主适配器所在生成路径记为线路1,副适配器所在生成路径记为线路2;对于路线1,将在时间步骤为t时扩散模型采样得到的图像记为类似定义ZB,t;路线1与路线2中主副适配器的差异表示为: 结合Tweedie公式有: 对上式求期望得损失函数: 3.4.设置结余损失函数,从损失函数上限制姿态,结余损失函数为: 步骤4.根据损失函数和结余损失函数得到全局优化函数,对输出的人物姿态图进行优化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。