首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于双规则因果特征选择的疾病因素数据处理方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:重庆邮电大学

摘要:本发明涉及医疗领域,特别涉及一种基于双规则因果特征选择的疾病因素数据处理方法,本发明将特征选择方法与因果贝叶斯网络结合,通过引入改进的OR规则和AND规则充分挖掘与疾病存在因果关系的疾病危险因素,避免了现有特征选择方法因挖掘错误的因果关系而导致有偏疾病预测输出;本发明通过融合双规则挖掘与疾病具有因果关系的父子特征和配偶特征,解决了当前疾病危险因素挖掘算法存在的假阳性与假阴性错误,并进一步采用分类器进行疾病预测,进而提高疾病诊断系统的精度。

主权项:1.一种基于双规则因果特征选择的疾病因素数据处理方法,其特征在于,所述方法包括:步骤1、获取医疗数据,并对所述医疗数据进行预处理;所述医疗数据包括疾病结果和可能的影响因素;所述影响因素包括行为数据、病理数据和人口统计数据;步骤2、通过条件独立性检验计算疾病结果与各个影响因素之间的条件独立性,确定出疾病相关因素,以及疾病相关因素的候选父子特征集合和候选配偶特征集合;步骤3、利用改进的OR规则,对步骤2所确定的疾病相关因素的候选父子特征集合和候选配偶特征集合中遗漏的疾病相关因素进行恢复;改进的OR规则设置为如果疾病相关因素V在疾病结果T的父子特征集合PCT中,或者疾病结果T在疾病相关因素V的父子特征集合PCV中,则疾病相关因素V是疾病结果T的父节点或孩子节点;如果疾病相关因素V在疾病结果T的配偶特征集合SPT中,或者疾病结果T在疾病相关因素V的配偶特征集合SPV中,则疾病相关因素V是疾病结果T的配偶节点;所述步骤3包括:获取疾病相关因素的候选父子特征集合PCST和候选配偶特征集合SPST,并确定出除候选父子特征集合PCST和候选配偶特征集合SPST外的特征集合Q;将集合Q中的各个疾病特征按与疾病结果T的相关性进行由高到低的排序;根据第一可调参数k_or与集合Q的特征数量|Q|乘积,确定待选择的特征数量|R|,并从集合Q中选择出排名靠前的|R|个特征,构成集合R;根据每一次迭代过程中从集合R中选择的疾病相关因素与除了集合R之外的疾病相关因素之间的条件独立性,得到当前迭代过程中特征Fi的疾病相关因素的候选父子特征集合PCSFi和候选配偶特征集合SPSFi,其中,i=1,2,…,|R|;如果疾病结果T在集合PCSFi中,那么特征Fi就是疾病结果T的父节点或孩子节点,并将特征Fi加入到集合or_PCT中,如果疾病结果T在集合SPSFi中,那么特征Fi就是疾病结果T的配偶节点,并将特征Fi加入到集合or_SPT中;将集合or_PCT加入到疾病相关因素的候选父子特征集合PCST,将集合or_SPT加入到疾病相关因素的候选配偶特征集合SPST,对步骤2所确定的疾病相关因素的候选父子特征集合PCST和候选配偶特征集合SPST中遗漏的疾病相关因素进行恢复;其中,集合or_PCT表示恢复疾病相关因素的候选父子特征集合,集合or_SPT表示恢复疾病相关因素的候选配偶特征集合;步骤4、利用改进的AND规则,对步骤2所确定的疾病相关因素的候选父子特征集合和候选配偶特征集合中错误的疾病相关因素进行剔除;改进的AND规则设置为1如果疾病结果T在疾病相关因素V的父子特征集合PCV中,且疾病相关因素V在疾病结果T的父子特征集合PCT中,则疾病相关因素V是疾病结果T的父节点或孩子节点;2如果疾病结果T在疾病相关因素V的配偶特征集合SPV中,且疾病相关因素V在疾病结果T的配偶特征集合SPT中,则疾病相关因素V是疾病结果T的配偶节点;所述步骤4包括:获取疾病相关因素的候选父子特征集合PCST和候选配偶特征集合SPST;将集合PCST的各个疾病特征按与疾病结果T的相关性进行由低到高的排序;将集合SPST的各个疾病特征按与疾病结果T的相关性进行由低到高的排序;根据第二可调参数k_and_pc与集合PCST的特征数量|PCST|乘积,确定选择的特征数|C|,并从集合PCST中选择出排名靠前的|C|个特征,构成集合C;根据每一次迭代过程中从集合C中选择的疾病相关因素与除了集合C之外的疾病相关因素之间的条件独立性,得到当前迭代过程中特征Pi的疾病相关因素的候选父子特征集合PCSPi和候选配偶特征集合SPSPi,其中,i=1,2,…,|C|;如果疾病结果T不在集合PCSPi中,则将特征Pi加入到集合and_PCT;根据第三可调参数k_and_sp与集合SPST的特征数量|SPST|乘积,确定选择的特征数|O|,并从集合SPST中选择出排名靠前的|O|个特征,构成集合O;根据每一次迭代过程中从集合O中选择的疾病相关因素与除了集合O之外的疾病相关因素之间的条件独立性,得到当前迭代过程中特征Oi的疾病相关因素的候选父子特征集合PCSOi和候选配偶特征集合SPSOi,其中,i=1,2,…,|O|;如果疾病结果T不在集合SPSOi中,则将特征Oi加入到集合and_SPT;将集合and_PCT从疾病相关因素的候选父子特征集合PCST中减去,将集合and_SPT从疾病相关因素的候选配偶特征集合SPST中减去,对步骤2所确定的疾病相关因素的候选父子特征集合PCST和候选配偶特征集合SPST中选择的错误疾病相关因素进行剔除;其中,集合and_PCT表示移除疾病相关因素的候选父子特征集合,集合and_SPT表示移除疾病相关因素的候选配偶特征集合;步骤5、将恢复、剔除后的候选父子特征集合和候选配偶特征集合作为疾病危险因素集合,并输出所述疾病结果对应的疾病危险因素集合。

全文数据:

权利要求:

百度查询: 重庆邮电大学 基于双规则因果特征选择的疾病因素数据处理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术