买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京精友时代信息技术发展有限公司
摘要:本发明涉及票据识别技术领域,具体是涉及一种用于人伤理赔的医疗票据信息整合方法,通过图像质量检测→图像处理→建立文本候选区域→结构化存储→修正→匹配分类→命名→数据入库的流程对用于保险结构的医疗票据信息进行整合,通过通过语义检测将票据分为标题候选区和其它候选区,依靠加权和逻辑处理,对票据进行分类的同时,标识票据的所属人、所属医院和所属地区;通过标签检索,可以就理赔人在多地或多医院的就医情况予以线性查看;或对多地区、多医院的同类型就医信息统一显示,从而为保险机构的理赔业务提供信息援助。
主权项:1.一种用于人伤理赔的医疗票据信息整合方法,其特征在于,具体包括以下步骤:S1、图像质量检测:采集票据图像,进行人工辅助识别;以票据图像是否存在严重图像不清、凭证种类错误、夹带票、金额不一致为标准,将不合格票据图像筛出并在前端提示;S2、图像处理:将经步骤S1筛选后的票据图像进行图像倾斜校正、灰度化处理以及断点处理;S3、建立文本候选区域:使用基于角点的检测网络对经步骤S2处理后的票据图像进行检测,输出紧密包围文本候选区域的四边形角点,得到多方向文本候选区域,并记录各文本候选区域的尺寸信息;S31、步骤S2处理后的票据图像首先经过用以提取特征映射图的共享卷积网络;S32、检测分支和识别分支在步骤S31的特征映像图上运行;S321、检测分支采用基于角点检测和位置敏感分割的方案,用来预测文本框;所述角点检测的模块结构如下:角点检测的默认文本框对应的输出包含四种角点的信息,每种角点信息有四个候选文本框的分支分值和偏移量;角点检测采用的预测模块,以卷积的方式预测两个分支的分值和偏移量;对于每个单元中带有k个默认文本框的m×n特征图,分值分支为每个默认文本框的每个类型角点输出的2个分值,偏移量分支为每个默认文本框的每个类型角点输出的4个偏移量;其中,分值分支的输出通道是k×q×2,2表示该位置是否有角点存在;偏移量分支的输出通道是k×q×4;q表示角点类型,默认值为4;S322、识别分支的分类编码器采用RNN结构,解码器采用CTC结构;S33、所述检测网络在识别分支之前还包括将步骤S31的特征映像图的特征与检测分支的文本框结果进行融合的RoIRotate运算环节;所述位置敏感分割的模块结构如下:在位置敏感分割模块中,使用一个g×g大小的网格,将文本框的边界框R分成多个分块,对于每个分块来说,使用一个分割图来判断其像素是否属于对应分块,因此可处理相近或相互叠加的文本区域;S4、结构化存储:对步骤S3文本候选区域的文本信息进行单字符切割,得到单字符图像;对所述单字符图像进行识别得到单字符文本;对所述单字符文本进行结构化存储;S5、修正:对发票中医学术语的语义检测与修正;对比大小写金额对金额数值进行检测修正;S6、匹配分类:所述步骤S4中文本候选区域中包括标题候选区域,对所述标题候选区域中的文本信息进行语义检测,以此对票据进行分类并命名:包括住院病历、诊断证明、医疗发票、费用清单和出院小结;S7、命名:根据步骤S4中得到的文本信息,完成对票据所属人、所属医院和所属地区的命名和录入;S8、数据入库:高置信度的票据文档自动入库;低置信度的票据文档给出警示,人工校验后入库;S9、对后续票据进行信息提取时,先检测票据的所属医院标签信息,然后对具有相同所属医院标签的票据进行票据尺寸以及文本候选区域的尺寸信息对比,若尺寸信息适配则标识类型入库;若尺寸信息不适配,则执行步骤S6~S8。
全文数据:
权利要求:
百度查询: 北京精友时代信息技术发展有限公司 一种用于人伤理赔的医疗票据信息整合方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。