买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国人民解放军总医院第六医学中心
摘要:本发明公开了一种基于人工智能的病案信息管理方法,方法包括数据采集、数据预处理、定义经济的下界、参数搜索和聚类。本发明属于数据处理技术领域,具体是指一种基于人工智能的病案信息管理方法,本方案通过计算经济的下界避免不必要的欧氏距离的计算,减少计算复杂度;基于快向量、段均值和非线性嵌入的下界计算方式更全面考虑数据特征,增强聚类的鲁棒性;基于三次映射初始化粒子群,设计自适应缩减移动参数激励粒子密集搜索,加速收敛,提高搜索效率;权衡局部搜索和全局搜索设计移动策略,提高搜索准确性。
主权项:1.一种基于人工智能的病案信息管理方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集;采集用户基本信息、病史信息、患者症状、治疗方案和医疗机构信息;步骤S2:数据预处理;对采集的数据进行数据清洗、数据转换和数据标准化处理;步骤S3:定义经济的下界;通过计算并权衡基于快向量、段均值和非线性嵌入的下界,从而定义经济的下界;步骤S4:参数搜索;基于三次映射初始化粒子群,设计自适应缩减移动参数;权衡局部搜索和全局搜索设计移动策略;步骤S5:聚类;在步骤S4中,所述参数搜索是对聚类用k值和经济权重进行搜索,具体包括以下步骤:步骤S41:混沌初始化粒子群,基于三次映射生成粒子群,将基于粒子位置的聚类结果的Calinski-Harabasz指数作为个体适应度值,初始化粒子群所用公式如下: ;式中,和分别是第n+1个和第n个粒子d维度的位置;是控制参数;步骤S42:设计移动参数,当粒子适应度值高于粒子群平均适应度值时,自适应缩减移动参数,否则基于随机数增加搜索随机性;所用公式如下: ; ; ;式中,是第k次迭代时的移动参数;和分别是最大移动参数和最小移动参数;是第i个粒子第k次迭代时的适应度值;和是粒子群的平均适应度值和最大适应度值;c1和c2分别是局部学习因子和全局学习因子;和分别是起始局部学习因子和终止局部学习因子;kmax是最大迭代次数;和分别是起始全局学习因子和终止全局学习因子;步骤S43:设计移动策略,所用公式如下: ; ;式中,和分别是第i个粒子d维度第k+1次迭代和第k次迭代时的速度;r1和r2是属于0到1的随机数且相互独立;是粒子个体历史最优位置;是粒子群最优位置;和分别是第i个粒子d维度第k+1次迭代和第k次迭代时的位置;a是加速度因子;步骤S44:移动判定,预先设有适应度阈值,当存在粒子适应度值高于适应度阈值时,参数搜索完成;若达到最大迭代次数,则重新初始化粒子群搜索参数;否则继续迭代移动搜索参数;在步骤S3中,所述定义经济的下界具体包括以下步骤:步骤S31:预定义,给定数据点x,bsf表示x与最近聚类中心之间的欧几里德距离;设c是下一个需要检查的聚类中心;在计算欧几里德距离EDx,c之前,首先计算经济的下界LBx,c;若LBx,cbsf,则有;因此,c不能是x的聚类中心,而无需计算昂贵的EDx,c;步骤S32:定义基于块向量的下界,包括:步骤S321:给定一个数据点,其中x1、x2和xd是数据点每个维度的值;将其平均分成b个块;每个块的大小为s,即每个块维度大小为s;若d不能被s整除,进行填充操作;得到第i个块;其中,i-1×s+1是块的起始维度索引,i×s是块的结束维度索引;数据点x被重写为;步骤S322:数据点规范化,规范后数据点x的块向量BV表示为,其中、和都是规范化后的数据点,规范化所用公式如下: ;式中,是规范化后的第i个数据点;j是维度索引;步骤S323:计算基于块向量的下界,所用公式如下: ;式中,LBBVx,y是基于块向量BVx和块向量y的下界;ED·是欧几里得距离;步骤S33:定义基于段均值的下界,包括:步骤S331:数据点段均值化,得到数据点x的段均值的表示为,其中、和都是段均值后的数据,段的数量b和块的数量相同;段均值化所用公式如下: ;式中,是第i段数据的均值;s1是每个段的维度大小,j是维度索引;步骤S332:计算基于段均值的下界,所用公式如下: ;式中,LBSMx,y是基于段均值SMx和段均值SMy的下界;步骤S34:定义基于非线性嵌入的下界,包括:步骤S341:计算数据方差,预先设第i段数据 ,所用公式如下: ;式中,是第i段数据中的方差;步骤S342:非线性嵌入表示,基于算术平均值和方差值,数据点x的非线性嵌入表示为:;步骤S343:计算非线性嵌入的下界,所用公式如下: ;式中,LBNEx,y是基于非线性嵌入的下界;和分别是非线性嵌入的向量y中第i段的均值和方差;步骤S35:计算经济的下界,所用公式如下:LBx,y=αLBBVx,y+βLBSMx,y+γLBNEx,y;式中,LB·是经济的下界;α、β和γ分别是基于块向量的下界、基于段均值的下界和基于非线性嵌入的下界的经济权重;在步骤S5中,所述聚类具体包括以下步骤:步骤S51:数据准备,获取数据集D={x1,x2,...,xN}、聚类中心数目k、初始聚类中心集合C={c1,c2,...,ck}和下界函数LB·;初始化迭代次数I=0,最大迭代次数MaxItr;步骤S52:初始化聚类中心,随机选择聚类中心,获取聚类中心集合C;步骤S53:迭代聚类,当I≤MaxItr或者未收敛时执行以下循环:步骤S531:对于数据集中的每个数据点x,执行以下步骤:步骤S5311:设置Ax=None,bsf=+∞,其中Ax是数据点所属的聚类中心;步骤S532:对于每个聚类中心c,执行以下步骤:步骤S5321:计算下界LBx,c;步骤S533:如果LBx,c≤bsf,则执行以下步骤:步骤S5331:计算欧几里得距离EDx,c;步骤S534:如果EDx,cbsf,则执行以下步骤:步骤S5341:更新bsf=EDx,c,Ax=c;步骤S535:更新聚类中心集合C;步骤S536:增加迭代次数I;步骤S54:返回最终的聚类中心集合C;步骤S55:数据整理,基于聚类结果实现病案信息整理统计。
全文数据:
权利要求:
百度查询: 中国人民解放军总医院第六医学中心 一种基于人工智能的病案信息管理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。