东北大学陈东明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北大学申请的专利一种基于混合样本的长尾图像数据分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115205594B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210839548.X,技术领域涉及:G06V10/764;该发明授权一种基于混合样本的长尾图像数据分类方法是由陈东明;薛皖东;赵文吕;聂铭硕;王冬琦设计研发完成,并于2022-07-18向国家知识产权局提交的专利申请。
本一种基于混合样本的长尾图像数据分类方法在说明书摘要公布了:本发明属于图像分类领域,设计了一种基于混合样本的长尾图像数据分类方法,本发明对图像分类研究中遇到的长尾训练集问题提出了一种新的解决方案,旨在使用三个具有特异化知识的专家共同辅助算法做出最终决策,避免单个模型带来的模型分类器权重偏差过大等问题。本发明适用于数据呈长尾分布的图像分类的业务场景,通过设计多个具备特定领域知识的专家,在不损失头部类分类精度的情况下,提高模型对于所有频率分布种类的分类性能,为数据长尾分布时图像分类的实际工程应用提供方案,缓解数据采集困难等问题,改进算法模型对头部类数据的过拟合情况并提高对尾部类数据的学习能力。
本发明授权一种基于混合样本的长尾图像数据分类方法在权利要求书中公布了:1.一种基于混合样本的长尾图像数据分类方法,其特征在于,具体包括以下步骤: 步骤1:使用常规采样和类平衡采样方法对图像数据数据集进行采样得到和随后使用Mixup混合样本方法获取图像数据混合样本X={xi,yi}则为混合采样生成训练集中的所有样本,其中xi,yi分别为单个样本的向量数据和标签,i∈{1,2,...,N}; 步骤2:根据步骤1采样得到的结果,分别得到专家E1、E2和E3的输出; 步骤3:基于步骤2得到的专家E1、E2和E3的输出;分别计算专家E1、E2和E3的损失,对以专家E1、E2和E3进行更新; 步骤4:基于专家E1、E2和E3的损失,更新模型参数; 步骤5:基于参数已经更新的模型,进行模型输出推理;在推理阶段,专家E1、E2和E3的采样样本均为xi,yi,对各个专家的输出向量取算数平均值即为推理阶段的最终输出; 其中,步骤1根据Mixup方法,则混合样本为: 其中,λ~Betaα,α为混合策略的随机值;得到的混合样本用于专家E1和E2的训练,E3则使用常规采样的样本进行训练;根据步骤1得到与后,使用共享的模型参数进行计算,得到和所述模型使用ResNet作为骨干网络,使用不同的网络层代表不同专家,每个专家的损失函数各不相同; 其中,步骤3具体为: 步骤3.1:根据步骤2得到的E1的输出,计算E1的损失 步骤3.2:根据步骤2得到的E2的输出,计算E2的损失 步骤3.3:根据步骤2得到的E3的输出,计算E3的损失 其中,步骤3.1计算E1的损失具体为: 对于E1,其定位是保留其原始学习方式,更加关注头部类信息提取,避免修改损失函数后导致头部类的良好学习能力被破坏,故采用最基础的交叉熵损失函数结合混合策略作为损失,E1的损失函数为: 其中λ来自混合样本策略,为交叉熵损失函数; 其中,步骤3.2计算E2的损失具体为: 对于E2,则在保持良好头部类特征学习能力的同时,兼顾到其他样本,起到平衡分类权重的效果;使用LDAM作为E2的核心损失函数;由于E2的输入样本为混合样本,其中的类平衡采样样本不适用于LDAM损失函数,故计算损失时仍沿用交叉熵损失函数,仅将LDAM用于部分,则E2的损失函数为: 其中,步骤3.3计算E3的损失具体为: 通过E3平衡分类重心,通过引入种类数量信息来调整输出z3,之后再使用Softmax进行回归,使得E3对于数量稀少的种类更加关注;故E3的损失函数为:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路3号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励