首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于非零均值漂移参数并行识别噪声样本的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:复旦大学

摘要:本发明提供一种基于非零均值漂移参数并行识别噪声样本的方法,利用含有非零均值漂移参数的线性回归模型对训练数据集中样本的特征矩阵以及标签矩阵进行拟合,并求解对应的非零均值漂移参数的解路径,并基于解路径选取识别出噪声样本,因此,本发明的方法能够在含噪学习中并行识别出多个噪声样本,并将噪声样本剔除出训练数据集,降低训练数据集中的噪声样本的比例,从而达到帮助模型训练,提升模型的性能的效果。本发明的方法由于同时基于特征空间以及标签空间,因此,相较于仅基于特征空间或仅基于标签空间的现有识别方法,识别准确度更高。此外,本发明的方法还具有较好的鲁棒性和算法泛用性。

主权项:1.一种神经网络模型训练方法,用于从含有多个样本的训练数据集中移除含有标签噪声的所述样本,将含有标签噪声的所述样本记作噪声样本,将其余的所述样本记作非噪声样本,其特征在于,包括:步骤S1,利用所述训练数据集对神经网络模型进行训练,并在训练过程中保存所有所述样本被所述神经网络模型提取的特征向量;步骤S2,利用所述训练数据集中被识别为所述非噪声样本的所述特征向量计算每个类别的特征原型;步骤S3,利用每个所述类别的所述特征原型计算所述类别之间的相似度,并根据所述相似度将所有所述类别划分为多个类别组,其中,每个所述类别组内的所述类别之间的所述相似度之和最小;步骤S4,将每个所述类别组内的所述样本划分为多个批次,以重采样的方式保证每个所述样本至少在一个所述批次中出现;步骤S5,对每个所述批次,利用含有非零均值漂移参数的线性回归模型拟合该批次的特征矩阵以及标签矩阵,并求解对应的所述非零均值漂移参数的解路径,其中,所述含有非零均值漂移参数的线性回归模型的公式如下:Y=Xβ+γ+ε,式中,β为所述线性回归模型的回归系数,γ为均值漂移参数,ε为随机的高斯噪声,X为特征矩阵,Y为标签矩阵;步骤S6,基于步骤S5求解的所述解路径,对每个所述批次选取部分所述样本作为识别出的所述噪声样本,将所有所述批次识别出的所述噪声样本合并并移除,从而形成新的训练数据集;步骤S7,判断所述神经网络模型是否收敛,当判断为是时完成所述神经网络模型的训练,当判断为否时重复步骤S1-S6,其中,所述训练数据集为ANIMAL10数据集或mini-WebVision数据集。

全文数据:

权利要求:

百度查询: 复旦大学 基于非零均值漂移参数并行识别噪声样本的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。