中国标准化研究院王蒙湘获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国标准化研究院申请的专利基于神经网络分类模型的多源数据筛选方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119719442B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411787822.9,技术领域涉及:G06F16/9035;该发明授权基于神经网络分类模型的多源数据筛选方法及系统是由王蒙湘;刘娜;庞永恒;付强;朱怀杰;万福军设计研发完成,并于2024-12-06向国家知识产权局提交的专利申请。
本基于神经网络分类模型的多源数据筛选方法及系统在说明书摘要公布了:本发明公开了基于神经网络分类模型的多源数据筛选方法及系统,包括:确定目标数据筛选规则并转为概率模型,获得特征组合联合概率密度函数,各类型数据构建神经网络分类模型,根据联合概率密度函数优化模型参数,组合不同数据类型的神经网络分类模型成多层神经网络分类模型,通过概率模型生成对抗样本进行训练,最后基于多层神经网络分类模型最后一层的梯度确定特征重要性,经聚类分析选特征组合筛选多源数据,根据筛选结果更新特征重要性,循环优化筛选过程。该方法能够处理和整合多种类型的数据源,提高数据利用的广度和深度,通过概率模型和神经网络的结合,实现对数据的精确筛选,提升决策质量,同时具有较好的可解释性。
本发明授权基于神经网络分类模型的多源数据筛选方法及系统在权利要求书中公布了:1.基于神经网络分类模型的多源数据筛选方法,其特征在于,包括以下步骤: 确定目标数据的筛选规则,将筛选规则中的条件和约束转换为概率模型,获取特征组合间的联合概率密度函数; 为每个类型的数据构建神经网络分类模型,根据所述联合概率密度函数的形态和边界区域优化每个神经网络分类模型的参数; 组合不同数据类型的神经网络分类模型,获得多层神经网络分类模型,利用所述概率模型生成对抗样本数据对多层神经网络分类模型进行训练; 基于所述多层神经网络分类模型最后一层的梯度确定特征的分类重要性,根据分类重要性进行聚类分析,选择用于筛选的特征组合对多源数据进行筛选; 根据筛选结果更新所述特征的分类重要性,持续优化筛选过程; 所述利用所述概率模型生成对抗样本数据对多层神经网络分类模型进行训练的方法,包括: 根据概率模型中特征的分布情况,确定每个特征的扰动范围; 利用概率模型中的条件概率关系确定扰动方向,若某特征变化使目标数据分类概率向错误方向变化概率高,则优先在该特征上沿使分类错误方向扰动; 对于数值型数据,在扰动范围内根据扰动方向通过基于梯度方法对关键特征进行调整生成对抗样本数据,对于文本型数据,基于扰动范围和扰动方向定位关键文本,对关键文本通过替换、插入或删除关键语义特征相关词汇生成对抗样本数据; 将正常样本数据和对抗样本数据组合作为训练集训练模型; 每个类型指按数据源或数据格式划分的独立数据类别,联合概率密度函数的形态指特征组合的联合概率分布特征,边界区域指联合概率密度函数梯度大于预设阈值的数据区域,即特征组合中影响筛选结果准确性的临界区域,持续优化筛选过程以提升筛选结果与目标数据的匹配度为目标,循环执行聚类筛选的过程,基于多层神经网络分类模型最后一层的梯度确定特征分类重要性通过聚类分析选择特征组合并筛选多源数据剔除弱相关特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国标准化研究院,其通讯地址为:100080 北京市海淀区知春路4号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。