中科视拓(北京)科技有限公司;中科深视(杭州)科技有限公司李竞元获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中科视拓(北京)科技有限公司;中科深视(杭州)科技有限公司申请的专利一种基于强化学习的小样本类增量识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116681945B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310688597.2,技术领域涉及:G06V10/764;该发明授权一种基于强化学习的小样本类增量识别方法是由李竞元;李勇;史鹏飞;钟鸿豪;王慧勇;山世光;山盛;高黎明;刘壮;高科;杨茹茵;申一中设计研发完成,并于2023-06-12向国家知识产权局提交的专利申请。
本一种基于强化学习的小样本类增量识别方法在说明书摘要公布了:本发明提供的一种基于强化学习的小样本类增量识别方法,所述识别方法包括:下载小样本类增量学习数据集;设计基于强化学习的小样本增量分类识别网络;利用训练数据对所述网络进行训练,获得训练网络;根据所述训练网络生成小样本类增量学习模型;采用所述小样本类增量学习模型进行小样本增量分类识别。解决上述现有技术未自适应探索新类分类器学习策略造成不能缓和小样本增量学习灾难遗忘的问题。
本发明授权一种基于强化学习的小样本类增量识别方法在权利要求书中公布了:1.一种基于强化学习的小样本类增量识别方法,其特征在于,所述识别方法包括: 下载小样本类增量学习数据集; 设计基于强化学习的小样本增量分类识别网络; 利用训练数据对所述网络进行训练,获得训练网络; 根据所述训练网络生成小样本类增量学习模型; 采用所述小样本类增量学习模型进行小样本增量分类识别; 所述分类器更新具体包括: 模型输入为数据集CIFAR-100,编码器φ采用ResNet20作为骨干,设Wt是某个阶段t时刻新类分类器的权重,如果每次增量阶段新类包含M个类别,则Wt=[w1,…,wk,…,wM]T,其中wk表示第k类的分类器权重,d表示特征维度; 对于来自批次数据X中的一张输入样本xi,使用余弦相似度来度量提取出的特征嵌入和对应的分类权重Wt来描述分类性能,并定义为分类器状态在获取当前批次数据预测状态St后,计算出当前时刻分类器的交叉熵损失: 其中,是独热编码下标签向量yi的第k个元素,表示分类器状态的第k个元素,对应新类中第k个类上样本xi的余弦距离;越大,表示越像第k类; 得到当前时刻分类器权重参数Wt的梯度并结合探索性优化模块得到的分类器学习策略at一起更新权重参数: 下一个分类器状态通过该次探索更新后的权重Wt+1,用样本xi计算得出;同时获得学习策略at的奖励其中R为奖励函数; 所述奖励函数R具体包括: 评估新类中类内紧致性的奖励rintra: 其中表示取对应于标签yi的操作; 评估新类数据的类间分散的奖励rinter: 当新的分类器参数Wt+1使输入样本xi越接近其他类时,奖励分数rinter变得越低,取变化最大的一项作为惩罚; 评估新旧类之间分散的奖励rcross: 其中,Yold表示当前阶段的旧类标签,样本xi的特征嵌入越接近旧类的分类器,奖励rcross值就越小,表示错误分类的情况越多; rintra表示相比于前一个分类器,更新后的分类器正确分类概率与前一个分类器相比的增益,其中正确分类概率与余弦度量成正比; rinter表示更新前后最大误分类概率的变化; rcross表示新类样本被错误分类到旧类的概率值之和,rcross越大,表示旧类的知识能被保留的越多; 强化学习的总奖励rtxi形式化:rtxi=rintraxi+rinterxi+rcrossxi; 所述探索性优化具体包括: 利用批判者ψ对分类器状态St进行评估,以获得长期回报vt,与分类器一步更新的奖励rt不同; vt从状态St开始评估分类器的性能,并使用at持续更新分类器; 下一个分类器状态St+1通过探索性批判者ψ得到返回值vt,描述了下一个状态St+1在长时间使用策略at后,对分类器性能的影响; 使用强化学习中单步差分的思想指导批判者ψ的学习: 其中,γ是一个比例系数,用来缩放未来的收益; 当前差异和当前分类器策略at的log值同时自适应地监督高斯行动者探索优化: 作为监督信号行动者损失La引导高斯行动者更新到 下一个分类器状态St+1通过更新后的行动者学习分类器策略均值μ和方差σ,并通过高斯采样Nμ,σ获得新的分类器学习策略at+1; 新策略at+1用于推动分类器参数Wt+1的下一次更新,交替推进分类器更新和分类器策略的探索性优化,并实现将新类分类器的更新和新类分类器的探索性优化集成到一个端到端闭环学习过程中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科视拓(北京)科技有限公司;中科深视(杭州)科技有限公司,其通讯地址为:100080 北京市海淀区知春路108号1号楼7层703;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励