买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南通大学
摘要:本发明提供了一种用于大规模认知障碍疾病检测的动态加权属性约简方法,属于医学信息智能处理技术领域,传统方法在处理大规模数据处理时间较长,复杂的认知障碍疾病特征选择中会导致不确定性的技术问题。其技术方案为:包括以下步骤:S1、大规模认知障碍疾病数据获取与预处理;S2、计算认知障碍疾病原始数据和增量数据的知识粒度;S3、构建动态特征交互加权属性树;S4、将构建的动态特征交互加权属性树分支,每轮分支结束时将低权重属性添加到交互集F中进行增量特征交互;S5、在所有属性树完成分支后,将计算节点约简集输出到主节点,获得大规模认知障碍疾病数据约简。本发明的有益效果为:可以有效提高特征选择的速度并提高精度。
主权项:1.一种用于大规模认知障碍疾病检测的动态加权属性约简方法,其特征在于,包括以下步骤:S1、大规模认知障碍疾病数据获取与预处理,具体如下:获取样本人群大脑的静息态功能磁共振成像图像,基于静息态功能磁共振成像构建脑功能连接网络;将脑功能连接网络数据进行预处理,并转换为一个四元组决策信息表S,存入HDFS文件系统;将获得的增量样本数据转换为一个四元组决策信息表S′,定义如下:S={U,C∪D,V,f},其中U={x1,x2,...,xN}表示认知障碍疾病数据集中的患者对象集合,N表示认知障碍病历数据的总数;S′={U′,C∪D,V,f},其中U′={x′1,x′2,...,x′M}表示增量认知障碍病历数据中的患者对象集合,M表示新增认知障碍病历数据的总数;C表示认知障碍病历中条件属性的非空有限集;D表示认知障碍病历中决策属性的非空有限集,且其中D=1表示患者存在认知障碍,其中D=0表示患者不存在认知障碍;V=Ua∈C∪DVa,Va是认知障碍病历中脑功能连接网络关系属性a的可能情况;f→U×C∪D是一个信息函数,为每个认知障碍病历赋予一个信息值,即x∈U,fx,a∈Va;S2、计算认知障碍疾病原始数据和增量数据的知识粒度,具体如下:采用数据分片技术,将HDFS文件系统中增量的决策信息表S'均分为k份S′={S′1,S′2,...,S′k},并分发到各计算子节点上,在各个子节点上分别计算增量决策信息表Si'中条件属性集C相对于决策属性D的知识粒度和原约简属性集B相对于决策属性D的知识粒度其中U′i表示第i个增量决策信息表S′i中认知障碍患者对象集合,若知识粒度相等,则直接输出约简属性集B,否则继续S3;S3、构建动态特征交互加权属性树,对所有属性进行聚类生成多棵树的根节点,并对根节点中属性进行权重初始化,具体如下:在计算节点上,对加入的增量大规模数据子集S′i的所有条件属性C执行K-means聚类算法,根据属性与属性之间相关性及属性与属性子集之间的相关性将所有条件属性集C划分成多个属性子集{C1,C2,...,Cj,...,Cn},n是聚类后的属性子集数量,其中Cj表示第j个属性子集,包含着相关性较高的一组条件属性,将每一个属性子集Cj作为一棵权属性树根节点进行分支;S4、将构建的动态特征交互加权属性树分支,每轮分支结束时将低权重属性添加到交互集F中进行增量特征交互,具体如下:初始化分支系数α;根据各属性ai与决策属性D的互信息与不同属性之间的互信息,计算各加权树根节点中所有属性的权重;根据属性的权重对各加权属性树进行子节点的划分,将权重值最大的属性WaMAX划分到右子节点MAXW中,并在每轮分支结束时添加到约简子集B中;将权重值最小的属性WaMIN划分到左子节点MINW中,并在每轮分支结束时添加到交互集F中进行增量特征交互;将剩余属性进行下一轮的属性树分支与特征交互;S5、在所有属性树完成分支后,将计算节点约简集输出到主节点,获得大规模认知障碍疾病数据约简,具体如下:在各个计算节点上,完成有属性树全部分支以及特征交互,将所有计算节点得到的约简子集Bi输出到Spark主节点上,Bi表示第i个计算节点得到的约简子集,并将所有计算节点的约简子集{B1,B2,...,Bk}作交集操作得到最终约简集。
全文数据:
权利要求:
百度查询: 南通大学 用于大规模认知障碍疾病检测的动态加权属性约简方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。