太原理工大学李凤莲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉太原理工大学申请的专利一种脑卒中筛查数据预处理方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115114995B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210834869.0,技术领域涉及:G06F18/211;该发明授权一种脑卒中筛查数据预处理方法和系统是由李凤莲;张雪英;黄丽霞;陈桂军;王夙喆;袁甜甜;左婷设计研发完成,并于2022-07-15向国家知识产权局提交的专利申请。
本一种脑卒中筛查数据预处理方法和系统在说明书摘要公布了:本发明涉及一种脑卒中筛查数据预处理方法和系统。本发明使用特征降维方法去除脑卒中筛查数据冗余噪声,对其进行特征选择,对选择后特征进行特征转换;针对脑卒中筛查数据的数据非平衡特性,进行过采样,使少数类及多数类样本趋于均衡,进而提高脑卒中筛查数据分析效率。
本发明授权一种脑卒中筛查数据预处理方法和系统在权利要求书中公布了:1.一种脑卒中筛查数据预处理方法,其特征在于,包括: 获取原始数据集;所述原始数据集包括脑卒中筛查数据; 采用基于最大信息系数的相关性特性特征选择方法对所述原始数据集进行特征选择,得到特征子集; 采用主成分分析法对所述特征子集进行特征提取,得到特征转换子集; 采用过采样技术对所述特征转换子集进行处理,得到平衡数据集;将所述平衡数据集作为预处理后的脑卒中筛查数据集; 采用基于最大信息系数的相关性特性特征选择方法对所述原始数据集进行特征选择,根据评价函数计算特征价值,利用最佳优先搜索方法,选择出特征子集F1;选用PCA算法对得到的特征子集F1进一步特征提取,得出最优的特征转换子集F2; 采用基于MAHAKIL与孤立森林的MRIF过采样技术对所述特征转换子集进行处理,得到平衡数据集,包括: 1将数据集D分为多数类子集Dmaj={dmaj1,dmaj2,…,dNmaj,}和少数类子集Dmin,Nmaj代表多数类样本数量,Nmin代表少数类样本数量,计算需要生成的样本数Nnew=Nmaj-Nmin; Dnew:待生成的新样本子集,初始化为0;Nnewnum:用于统计生成样本的数量,初始化为0; 2选择中心样本,获得Dmin即少数类子集中每个样本与中心样本的马氏距离,并将少数类样本按照求得的马氏距离大小顺序递减排列保存到DminMA; 3找到Dmin的中心点,设即Nmid为Nmin2的下近似:按照马氏距离大小,将DminMA中的样本从中心位置进行划分,将样本分为两部分Dpar1和Dpar2,并对两部分数据分配对应相同的标签,以实现配对;配对是按照顺序完成的,即两部分样本相同位置的样本都给一个一样的标签,将其标记为一对;依次对Dpar1和Dpar2所有样本按序实现配对;配对方式如下: 其中Dpar1和Dpar2中数据皆按照降序排列; 设dpar1i∈Dpar1,dpar2i∈Dpar2,对Dpar1和Dpar2中位于相同排序位置的样本分配相同的标签li,i=1,2,...Nmid; 4如果i=1,…,Nmid; 从Dpar1,Dpar2分别选取样本da,db,且da,db两个样本标签一样,即为配对样本:lida=lidb; 生成新的样本: dnewi=da×random+db×1-random;random为0至1之间的随机数; 将dnewi添加到Dnew;Nnewnum+1; 5如果Nnewnum<Nnew,则将Dnew中的样本与Dpar中的样本重组并用其更新Dmin,重复步骤2到步骤6生成新的少数类样本; 6直至Dnewnum>=Nnew,Dnew中的所有样本即为生成的少数类样本; 7采用孤立森林ISF算法去除新生成样本中的噪声样本,得到新的非平衡数据集D′; 8采用SMOTE过采样技术产生新样本,将新样本和D′合并,得到最终平衡数据集Dfinal。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人太原理工大学,其通讯地址为:030024 山西省太原市迎泽西大街79号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。