南京大学王心悦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利一种基于MLP无需分块嵌入映射的视觉识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116563613B 。
龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310401160.6,技术领域涉及:G06V10/764;该发明授权一种基于MLP无需分块嵌入映射的视觉识别方法是由王心悦;蔡志成;曹汛;沈秋设计研发完成,并于2023-04-15向国家知识产权局提交的专利申请。
本一种基于MLP无需分块嵌入映射的视觉识别方法在说明书摘要公布了:本发明提出了一种基于MLP无需分块嵌入映射的视觉识别方法。该方法通过引入一种新的提取特征的方法,对视觉特征提取完全解耦合,从宽度,高度和通道三个维度单独地顺序地交替地进行特征提取,在保证模型表示能力的前提下极大降低了模型的参数量。本发明对于现有的多层感知机模型,是首个完全使用全连接层堆叠而成的模型,无需对输入图像进行卷积映射编码或分块嵌入等操作。
本发明授权一种基于MLP无需分块嵌入映射的视觉识别方法在权利要求书中公布了:1.一种基于MLP无需分块嵌入映射的视觉识别方法,其特征在于,包括以下步骤: 步骤1,将N层MLP层堆叠成主干模型;直接将图像输入到主干模型中,无需进行卷积映射编码或分块嵌入的操作; 步骤2,对于每一层MLP层,给定输入特征映射为X,尺寸为W*H*C,W,H和C分别表示宽度、高度和通道数维度,首先经过批量归一化层BN1进行批量归一化得到特征映射BN1X; 步骤3,使用由W个不同线性映射构成的宽度多层感知机模块在H*C平面的每个像素位置点交互提取步骤2所得特征映射BN1X的宽度维度特征信息,得到特征映射U; 步骤4,使用由H个不同线性映射构成的高度多层感知机模块在C*W平面的每个像素位置点交互提取步骤3所得特征映射U的高度维度特征信息,得到特征映射V;将特征映射V经过批量归一化层BN2进行批量归一化得到特征映射BN2V;将BN2V与步骤2所得特征映射BN1X相加,接着再次经过批量归一化层BN3进行批量归一化得到特征映射S; 步骤5,堆叠E*C个不同线性映射构成的第一个全连接层、第一激活层、批量归一化层BN4、C个不同线性映射构成的第二个全连接层、第二激活层和批量归一化层BN5得到通道多层感知机模块,其中E为扩张系数,用于调整第一个全连接层的输出特征通道数;在W*H平面的每个像素位置点交互提取步骤4所得特征映射S的通道数维度特征信息,得到特征映射O; 步骤6,将步骤5特征映射O与步骤4特征映射S相加,得到当前MLP层的输出特征映射X’,作为输入特征映射输入到下一层MLP层,继续进行特征提取;重复步骤2~步骤6,直到最后一层MLP层; 步骤7,将所述主干模型的输出输入到全局平均池化层以及用于分类的线性全连接层,进行图像识别分类,输出最终预测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210046 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励