买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江大学
摘要:本发明公开了一种医保群体异常行为检测方法和装置,包括:获取医保结算数据并进行预处理后提取医保结算的关键特征;基于关键特征构建三个维度的动态图,分别为表征购药次数的动态图、表征药品种类多样性的动态图、以及表征购药金额的动态图;将三个维度的动态图进行融合得到融合图,并对融合图进行医保群体的社区发现搜索,基于搜索的社区集合构建社区图;利用自编码器对社区图进行编码和解码重建,并计算社区图的重建误差作为异常指标,来筛选社区图中的异常社区,实现医保群体异常行为的检测,这样可以有效提升医保异常行为的识别速度和准确度。
主权项:1.一种医保群体异常行为检测方法,其特征在于,包括以下步骤:获取医保结算数据并进行预处理后提取医保结算的关键特征,其中,关键特征包括:购药信息、金额、购药时间、以及医疗机构名称和编码;基于关键特征构建三个维度的动态图,分别为表征购药次数的动态图、表征药品种类多样性的动态图、以及表征购药金额的动态图;其中,表征购药次数的动态图表示为,其中,表示时间窗口t对应的动态图中节点集合,每个节点表示存在购药行为和记录的参保人; 表示时间窗口t对应的动态图中节点之间的边集合,每条边表示购药行为关系,如果任意两个参保人在同一时间窗口内在同一医疗机构购买过药品,则这两个参保人对应的节点之间存在一条边; 表示时间窗口t对应的动态图中存储每条边权重的矩阵,每条边权重基于任意两位参保人在给定时间窗口内共同出现在购药记录中的次数计算得到,计算公式为: ;其中,表示时间窗口t对应的动态图中两个参保人i和j对应节点之间的边权重,为指示函数,如果在时间窗口t内两个参保人i和j在同一医疗机构k存在购药记录,则的数值是1,否则为0,K表示时间窗口t内两个参保人i和j共同出现在数据中的医疗机构数量;在t到t+1的时间窗口的动态变化中,,其中,、、以及分别表示节点增量、边增量、以及权重增量;表征药品种类多样性D的动态图表示为,其中,表示时间窗口t对应的动态图中节点集合,每个节点表示存在购药行为和记录的参保人; 表示时间窗口t对应的动态图中节点之间的边集合,每条边表示购药行为关系,如果任意两个参保人在同一时间窗口内的同一机构购买过相同药品,则这两个参保人对应的节点之间存在一条边; 表示时间窗口t对应的动态图中存储每条边权重的矩阵,每条边权重基于香农熵来表达,表示两个参保人i和j在购药行为中的药品种类多样性,计算公式为: ;其中,表示时间窗口t对应的动态图中两个参保人i和j对应节点之间的边权重,表示香农熵,表示两个参保人i和j在t时间窗口内购买相同药品的概率,通过相同药品的购买次数除以两参保人总的药品购买次数来计算,L表示两个参保人i和j之间共同购买的药品种类数量;在t到t+1的时间窗口的动态变化中,,其中,、、以及分别表示节点增量、边增量、以及权重增量;表征购药金额M的动态图表示为,其中,表示时间窗口t对应的动态图中节点集合,每个节点表示存在购药行为和记录的参保人; 表示时间窗口t对应的动态图中节点之间的边集合,每条边表示购药行为关系,如果任意两个参保人在同一时间窗口内的同一机构购买过药品,则这两个参保人对应的节点之间存在一条边; 表示时间窗口t对应的动态图中存储每条边权重的矩阵,每条边权重基于任意两位参保人在给定时间窗口内在同一机构的购药金额计算得到,计算公式为: ;其中,表示时间窗口t对应的动态图中两个参保人i和j对应节点之间的边权重,表示在t时间窗口第ts次交易中两个参保人i和j的购药金额之和,表示两个参保人i和j在一个机构内的交易总次数;在t到t+1的时间窗口的动态变化中,,其中,、、以及分别表示节点增量、边增量、以及权重增量;将三个维度的动态图进行融合得到融合图,包括:将三个维度的动态图中的节点和连边进行合并,得到节点集合和边集合,同时将表征购药次数的动态图、表征药品种类多样性D的动态图、以及表征购药金额M的动态图中的边权重、以及分别进行各自的标准化后,将标准后的边权重、、进行加权得到权重矩阵,得到融合图;其中,,,和表示每个边权重的权重系数,且,,;对融合图进行医保群体的社区发现搜索,基于搜索的社区集合构建社区图,包括:采用基于模块度优化的社区发现算法Louvain对融合图进行医保群体的社区发现搜索,在搜索时引入模块度Q来衡量社区划分质量的指标,对于融合图,模块度Q定义为: ;其中,表示融合图中两个参保人i和j对应节点之间的边权重,和分别是两个参保人i和j对应节点的权重度,权重度为节点相连的所有边的权重和,2m表示融合图中所有边权重的总和,,表示指示函数,如果两个参保人i和j在同一个社区则为1,否则为0,表示用于控制期望社区的分辨率参数;基于搜索的社区集合构建社区图,表示为,其中,表示社区集合,表示时间窗口t内所有社区内部及社区间的边集合的并集,表示时间窗口t内中每条边的权重集;利用自编码器对社区图进行编码和解码重建,并计算社区图的重建误差作为异常指标,来筛选社区图中的异常社区,实现医保群体异常行为的检测,包括:构建社区图的节点特征矩阵和邻接矩阵,其中,节点特征矩阵X为n×d矩阵,n表示社区数量,d表示每个社区的特征数量,特征包括社区的大小、内部边的权重总和、平均节点度和边密度,每个社区的特征值汇总并形成节点特征矩阵X中的一行,每一行代表一个社区的特征向量;邻接矩阵A为n×n的矩阵,表示社区之间的连接关系,A中的元素表示两个社区和之间的边的权重,如果两个社区和没有直接的连接,则=0;自编码器包含采用图卷积层的编码器和采用逆图卷积层的解码器,输入的节点特征矩阵和邻接矩阵依次经过编码器和解码器的编码和解码得到重构的节点特征矩阵,并基于输入的节点特征矩阵和重构的节点特征矩阵之差得到重建误差;依据重建误差从社区图中筛选重建误差高于阈值的社区作为异常社区。
全文数据:
权利要求:
百度查询: 浙江大学 一种医保群体异常行为检测方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。