买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:赣州市第五人民医院
摘要:本发明公开了基于人工智能的高流量湿化治疗仪管理方法及系统,方法包括:数据采集、缺失值处理、平衡数据集、构建高流量湿化治疗仪管理模型和高流量湿化治疗仪管理。本发明属于治疗仪管理技术领域,具体是指基于人工智能的高流量湿化治疗仪管理方法及系统,本方案使用局部中值和高斯朴素贝叶斯算法填补缺失值;过滤孤立样本点,通过计算多数类聚类中心和子聚类的距离,确定每个子聚类的权重值和需要合成的新样本数量,使用随机线性插值和最近邻样本生成新样本;使用切比雪夫混沌地图生成初始位置并使用精英反向策略进行优化,基于动态权重因子、Levy飞行策略和突变策略进行位置更新,完成模型的构建。
主权项:1.基于人工智能的高流量湿化治疗仪管理方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集,采集高流量湿化治疗仪数据;步骤S2:缺失值处理,基于缺失值数量对特征排序,优先对缺失值数量少的特征使用局部中值和高斯朴素贝叶斯算法填补缺失值;步骤S3:平衡数据集,过滤孤立样本点,计算多数类聚类中心和为少数类样本集生成子聚类,通过计算多数类聚类中心和子聚类的距离,确定每个子聚类的权重值和需要合成的新样本数量,使用随机线性插值和最近邻样本生成新样本;步骤S4:构建高流量湿化治疗仪管理模型,使用切比雪夫混沌地图生成初始位置并使用精英反向策略进行优化,基于动态权重因子、Levy飞行策略和突变策略进行位置更新,完成模型的构建;步骤S5:高流量湿化治疗仪管理,基于高流量湿化治疗仪管理模型输出的标签,对高流量湿化治疗仪进行管理;在步骤S4中,所述构建高流量湿化治疗仪管理模型具体包括以下步骤:步骤S41:构建训练数据集和测试数据集,从平衡数据集中随机选取70%的样本数据作为训练数据集,其余30%的样本数据作为测试数据集,用模型参数代表个体的位置;步骤S42:初始化位置,步骤如下:步骤S421:使用切比雪夫混沌地图生成个体初始位置,所用公式如下: ;式中,是第a个个体在第d维的初始位置,LBd是个体搜索空间第d维的下边界,UBd是个体搜索空间第d维的上边界,ca-1是第a-1个个体的切比雪夫混沌值,c0是[0,1]内的随机数,a是个体索引,cos()是余弦函数,d是维度索引,N4是个体数量,D是个体维度;步骤S422:训练高流量湿化治疗仪管理模型,利用python导入sklearn库基于当前参数调用SVM函数,基于训练数据集训练高流量湿化治疗仪管理模型,将基于参数建立的高流量湿化治疗仪管理模型性能作为个体适应度值;步骤S423:优化精英个体初始位置,计算个体的适应度值,将其按照从大到小的顺序进行排列,选择前N5个个体作为精英个体,使用基于精英反向策略优化精英个体的初始位置,所用公式如下: ;式中,是优化后第a个个体在第d维的初始位置,是步骤S421后的所有个体在第d维的下边界,是步骤S421后的所有个体在第d维的上边界,r1是[0,1]内的随机数,N5是精英个体的数量且N5N4;步骤S43:计算最优适应度值和全局最优位置,更新个体的适应度值,选择最高的适应度值作为最优适应度值Ebest,将最优适应度值Ebest对应的个体位置作为全局最优位置Cbest;步骤S44:位置更新,步骤如下:步骤S441:基于动态权重因子更新个体位置,为所有个体随机生成一个[0,1]内的随机数r3a,所用公式如下: ; ;式中,ω是动态权重因子,t是当前迭代次数,T是最大迭代次数,RT是安全阈值且RT∈[0.5,1],μ是[0,0.1]内的随机数,Ca,d(t+1)是第t+1次迭代时第a个个体在第d维的位置,Ca,d(t)是第t次迭代时第a个个体在第d维的位置,exp()是以自然常数e为底的指数函数,r2是(0,1]内的随机数,G是服从正态分布的随机数,H是1×D行向量且其中所有元素都是1;步骤S442:基于Levy飞行策略和突变策略优化位置,更新个体的适应度值和当前全局最优位置Cbest(t+1),所用公式如下: ;式中,是优化后第t+1次迭代时第a个个体在第d维的位置,σ是突变因子且σ∈[0,1];步骤S45:模型确定,预先设定适应度值评估阈值δ,更新最优适应度值和全局最优位置,当最优适应度值Ebest高于适应度值评估阈值δ时,则基于当前模型参数构建高流量湿化治疗仪管理模型;否则,若达到最大迭代次数T,则转至步骤S42;否则转至步骤S44;在步骤S3中,所述平衡数据集具体包括以下步骤:步骤S31:过滤孤立样本点,基于缺失值处理后的数据构建原始不平衡数据集B、少数类样本集F和多数类样本集L,基于KNN算法计算少数类样本集F中所有样本点的K个最近邻样本,将K个最近邻样本都是多数类样本的样本点作为孤立样本点并删除;步骤S32:计算需要插入的总样本数量,预先设定采样后数据集的平衡率M,平衡率是数据集中少数类样本数量与多数类样本数量的比值,所用公式如下:f’=M×l;fadd=f’-(f-f0);式中,fadd是需要插入的总样本数量,f’是采样后少数类样本集中的样本数量,f是少数类样本集中的样本数量,f0是孤立样本点的数量,l是多数类样本集中的样本数量;步骤S33:计算多数类聚类中心,所用公式如下: ; ;式中,是多数类样本的第i个特征的平均值,i是特征索引,xij是多数类样本集L中的第j个样本的第i个特征,j是样本索引,N2是多数类样本集L中的l个样本中存在的特征数量,是多数类聚类中心样本;步骤S34:计算距离,使用K-means算法为少数类样本集F生成O个子聚类,每个子聚类的聚类中心为Qb,基于欧式距离算法计算每个子聚类的聚类中心Qb与多数类聚类中心之间的距离,所用公式如下: ; ;式中,是少数类中第b个聚类中心的第i个特征,b是聚类中心索引,gb是少数类中第b个聚类中心与多数类聚类中心之间的距离;步骤S35:计算每个子聚类的权重值,所用公式如下: ; ;式中,Wb是少数类中第b个子聚类的权重值;步骤S36:计算每个子聚类需要合成的新样本,所用公式如下:hb=Wb×fadd,b=1,2,…,O;式中,hb是第b个子聚类中需要合成的新样本个数;步骤S37:生成新样本,步骤如下:步骤S371:设定合成新样本初始值,随机选择一个子聚类Qb,从子聚类Qb中随机选择其中的一个样本u,根据KNN算法确定该样本u的z个最近邻样本,预先设定当前选择的子聚类Qb合成的新样本个数为vb,vb的初始值为0;步骤S372:选择合成方式,若z≥(hb-vb),则转至步骤S3721,选择第一种合成方式合成新样本;否则,转至步骤S3722,选择第二种合成方式合成新样本,步骤如下:步骤S3721:第一种合成方式,通过选择的样本u与其(hb-vb)个最近邻样本之间的随机线性插值分别生成总共(hb-vb)个新样本,则当前子聚类Qb的新样本合成完成,转至步骤S373,所用公式如下:unew=u+rand(0,1)×(u-uz1);式中,unew是生成的新样本,rand(0,1)是生成一个0到1之间的随机数,uz1是样本u的(hb-vb)个最近邻样本中的一个样本;步骤S3722:第二种合成方式,通过选择的样本u与其z个最近邻样本之间的随机线性插值分别生成总共z个新样本,并更新vb的值,从当前选择的子聚类Qb中的剩余样本中重新随机抽取一个样本w,样本w≠样本u,转至步骤S372重新选择合成方式;步骤S373:完成新样本生成,重复步骤S371-步骤S372,直至完成所有子聚类的新样本生成;步骤S38:构建平衡数据集,将所有子聚类生成的新样本添加到原始不平衡数据集B中,获得平衡率为M的平衡数据集;在步骤S2中,所述缺失值处理具体包括以下步骤:步骤S21:计算缺失值数量并进行排序,基于采集的高流量湿化治疗仪数据构建原始特征矩阵,计算原始特征矩阵的每个特征的缺失值数量,根据缺失值数量的大小对特征进行排序,得到特征的索引值,所用公式如下:sortindex=argsort(A.isnull().sum());式中,A是特征矩阵,isnull()用于判断每个元素是否为缺失值,sum()用于计算每个特征的缺失值数量,argsort()用于返回排序后的索引值,sortindex是特征矩阵中每个特征的缺失值数量的排序索引;步骤S22:填补缺失值,对缺失值数量最少的特征列进行缺失值填充处理,步骤如下:步骤S221:特征处理,对原始特征矩阵进行装箱并离散化,得到N1个类别;步骤S222:构建特征训练集和特征预测集,基于缺失值数量为0的特征列构建特征预测集,基于缺失值数量不为0的特征列构建特征训练集;步骤S223:处理特征训练集,选择特征训练集中缺失值数量最少的特征列进行处理,用特征列的中位数对缺失值进行填补;步骤S224:训练高斯朴素贝叶斯模型,使用处理后的特征训练集和数据分类标签训练高斯朴素贝叶斯模型;步骤S225:预测缺失值,使用训练好的高斯朴素贝叶斯模型对特征预测集进行预测,得到缺失值的预测结果;步骤S226:更新原始特征矩阵,对预测结果进行反装箱操作,得到原始的连续值,用来填补缺失值数量最少的特征列的缺失值,使用填补后的特征列更新原始特征矩阵;步骤S23:填充完整,重复步骤S22,选择下一个缺失值数量最少的特征列进行处理,直至填充所有的缺失值。
全文数据:
权利要求:
百度查询: 赣州市第五人民医院 基于人工智能的高流量湿化治疗仪管理方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。