首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

投保风险预测方法、装置、计算机设备和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本申请涉及大数据分析领域,特别涉及一种投保风险预测方法、装置、计算机设备和存储介质。所述方法包括:接收用户终端发送的投保申请,投保申请携带有就诊数据;根据预设清洗规则对就诊数据进行清洗;将清洗后的就诊数据进行向量化处理生成就诊向量;将就诊向量输入医疗坐标模型中得到就诊向量对应的第一治疗数据;根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用,当诊疗费用大于预设费用时,则将投保申请标记为风险申请。采用本方法根据对历史的投保记录中大量数据进行分析得到的医疗坐标模型,能够更准确地预测投保用户的投保风险。

主权项:1.一种投保风险预测方法,其特征在于,所述方法包括:接收用户终端发送的投保申请,所述投保申请携带有就诊数据;根据预设清洗规则对所述就诊数据进行清洗;将清洗后的所述就诊数据进行向量化处理生成就诊向量;将所述就诊向量输入医疗坐标模型中得到所述就诊向量对应的第一治疗数据;所述医疗坐标模型是以多名历史投保用户的历史就诊数据为样本数据训练的、能够根据就诊向量得到与就诊向量对应的第一治疗数据的多维坐标模型;根据所述第一治疗数据计算所述投保用户在预设投保时间内的诊疗费用,当所述诊疗费用大于预设费用时,则将所述投保申请标记为风险申请;当所述诊疗费用不大于预设费用时,则向所述用户终端发送申请成功的消息;接收所述用户终端发送的投保指令;根据所述投保指令进行投保;所述将所述就诊向量输入医疗坐标模型中得到所述就诊向量对应的第一治疗数据,包括:根据所述就诊向量获取与所述就诊向量相关的历史用户;获取所述历史用户的第二治疗数据,并将所述第二治疗数据作为所述投保用户的所述第一治疗数据;所述医疗坐标模型的生成方式,包括:获取历史申请,所述历史申请包括就诊样本和治疗样本;从所述就诊样本和治疗样本中提取预设字段名称,根据所提取的预设字段名称建立多维坐标系;将所述就诊样本进行向量化处理得到就诊样本向量,对所述治疗样本进行向量化处理得到治疗样本向量;根据所述预设字段名称将所述就诊样本向量和所述治疗样本向量绘制在所述多维坐标系中;根据绘制完成的多维坐标系得到样本点阵,所述样本点阵用于反映所述就诊样本向量和所述治疗样本向量之间相关性;获取初始坐标模型,根据所述样本点阵对所述初始坐标模型进行训练得到医疗坐标模型。

全文数据:投保风险预测方法、装置、计算机设备和存储介质技术领域[0001]本申请涉及计算机技术领域,特别是涉及一种投保风险预测方法、装置、计算机设备和存储介质。背景技术[0002]随着现在科技的发展,医疗保险越来越趋于数据化,在投保用户提出参保请求时,需要判断此投保用户是否存在投保风险。[0003]传统地,在判断申请医保的投保用户的投保风险时,可以根据医学研究和医保历史数据建立就诊数据和治疗数据之间的关联,建立专家规则对投保用户的数据进行分组,来评估投保用户的投保风险;然而,采用该种方式建立的专家规则在对实际参保人群进行分析时,不具灵活性,无法准确地对投保用户的投保风险进行准确预测。发明内容[0004]基于此,有必要针对上述技术问题,提供一种能够准确预测投保申请的风险的投保风险预测方法、装置、计算机设备和存储介质。[0005]一种投保风险预测方法,所述方法包括:[0006]接收用户终端发送的投保申请,所述投保申请携带有就诊数据;[0007]根据预设清洗规则对所述就诊数据进行清洗;[0008]将清洗后的所述就诊数据进行向量化处理生成就诊向量;[0009]将所述就诊向量输入医疗坐标模型中得到所述就诊向量对应的第一治疗数据;[0010]根据所述第一治疗数据计算所述投保用户在预设投保时间内的诊疗费用,当所述诊疗费用大于预设费用时,则将所述投保申请标记为风险申请。[0011]在其中一个实施例中,所述将所述就诊向量输入训练好的医疗坐标模型中得到所述就诊向量对应的第一治疗数据,包括:[0012]根据所述就诊向量获取与就诊向量相关的历史用户;[0013]获取所述历史用户的第二治疗数据,并将所述第二治疗数据作为所述投保用户第一治疗数据。[0014]在其中一个实施例中,所述当所述诊疗费用大于预设费用时,则将所述投保申请标记为风险申请之后,还包括:[0015]根据所述诊疗费用确定所述投保申请对应的风险等级;[0016]当所述风险等级未超出预设等级时,则根据所述诊疗费用计算所述投保用户的投保价格。[0017]在其中一个实施例中,所述根据所述第一治疗数据计算所述投保用户在预设投保时间内的诊疗费用之后,还包括:[0018]当所述诊疗费用不大于预设费用时,则向所述用户终端发送申请成功的消息;[0019]接收所述用户终端发送的投保指令;[0020]根据所述投保指令进行投保。、[0021]在其中一个实施例中,所述将所述就诊向量输入医疗坐标模型中得到所述就诊向量对应的第一治疗数据之后,还包括:[0022]根据所述第一治疗数据识别所述投保用户对应的诊疗类型;[0023]所述获取投保指令,包括:[0024]根据所述诊疗类型获取与所述诊疗类型对应的投保推荐;[0025]将所述投保推荐发送至所述用户终端;[0026]继续接收所述用户终端发送的投保指令。[0027]在其中一个实施例中,所述医疗坐标模型的生成方式,包括:[0028]获取历史申请,所述历史申请包括就诊样本和治疗样本;[0029]从所述就诊样本和治疗样本中提取预设字段名称,根据所提取的预设字段名称建立多维坐标系;[0030]将所述就诊样本进行向量化处理得到就诊样本向量,对所述治疗样本进行向量化处理得到治疗样本向量;[0031]根据所述预设字段名称将所述就诊样本向量和所述治疗样本向量绘制在所述多维坐标系中;[0032]根据绘制完成的多维坐标系得到样本点阵,所述样本点矩阵用于反映所述就诊样本向量和所述治疗样本向量之间相关性;_[0033]获取初始坐标模型,根据所述样本点阵对所述初始坐标模型进行训练得到医疗坐标模型。[0034]在其中一个实施例中,所述方法还包括:[0035]获取验证就诊数据和与验证就诊数据对应的验证治疗数据;[0036]将所述验证就诊数据进行向量化处理得到验证就诊向量,将所述验证就诊向量输入至所述医疗坐标模型得到模型治疗数据;[0037]当所述验证治疗数据与所述模型治疗数据的差值大于预设值时,根据所述验证治疗数据纠正所述医疗坐标模型。[0038]一种投保风险预测装置,所述装置包括:[0039]申请接收模块,用于接收用户终端发送的投保申请,所述投保申请携带有就诊数据;[0040]清洗模块,用于根据预设清洗规则对所述就诊数据进行清洗;[0041]向量化模块,用于将清洗后的所述就诊数据进行向量化处理生成就诊向量;[0042]模型处理模块,用于将所述就诊向量输入训练好的医疗坐标模型中得到所述就诊向量对应的第一治疗数据;[0043]风险分析模块,用于根据所述第一治疗数据计算所述投保用户在预设投保时间内的诊疗费用,当所述诊疗费用大于预设费用时,则将所述投保申请标记为风险申请。[0044]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。[0045]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。[0046]上述投保风险预测方法、装置、计算机设备和存储介质,能够根据预设清洗规则对用户终端发送的就诊数据进行清洗,并进行向量化处理生成能够在训练好的医疗坐标模型中表示的就诊向量,通过就诊向量在医疗坐标模型中的位置活动与就诊向量对应的第一治疗数据,即投保用户的就诊数据最可能的治疗方案,以此预测此投保用户的投保风险;上述医保风险预测方法,根据实际的历史投保数据训练的医疗坐标模型,更准确地反映就诊数据和治疗数据之间的关联,能够更准确地预测投保用户的投保风险。附图说明[0047]图1为一个实施例中投保风险预测方法的应用场景图;[0048]图2为一个实施例中投保风险预测方法的流程示意图;[0049]图3为一个实施例中模型训练方式的流程示意图;[0050]图4为一个实施例中模型验证方式的流程示意图;[0051]图5为一个实施例中投保风险预测装置的结构框图;[0052]图6为一个实施例中计算机设备的内部结构图。具体实施方式[0053]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。[0054]本申请提供的投保风险预测方法,可以应用于如图1所示的应用环境中。其中,终端与服务器通过网络进行通信。服务器从终端获取投保用户的投保请求,先对投保请求中用户的就诊数据进行清洗、进行向量化处理,生成就诊向量,将就诊向量输入医疗坐标模型中,通过模型训练的数据,匹配出此就诊向量对应的第一治疗数据,根据治疗数据预测此投保用户在保期内的诊疗费用,以估计其投保申请的风险。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。[0055]在一个实施例中,如图2所示,提供了一种投保风险预测方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:[0056]S202,接收用户终端发送的投保申请,投保申请携带有就诊数据。[0057]其中,用户终端是投保用户的移动终端设备,如手机、电脑等;投保用户通过用户终端向服务器发送投保请求,例如用户在用户终端上进行选择保险操作,并填写对应的投保用户的健康信息,用户终端根据用户的选择操作生成投保请求。投保请求是投保用户通过用户终端向服务器发送的请求信息,用于告知服务器此投保用户有购买医保产品的倾向。[0058]就诊数据是用于反映此投保用户的门诊信息的数据,可以是投保用户在投保请求中提供的门诊数据。[0059]具体地,在投保用户通过用户终端对服务器发起投保申请时,需要提供投保用户的就诊数据,服务器接收投保用户通过用户终端发送给服务器的投保请求,获取投保申请中的就诊数据。[0060]可选地,服务器也可以在获取用户终端发送的投保请求,然后根据投保用户的个人信息,从医院等相关机构的数据库中获取此投保用户的健康信息,并通过此健康信息补充投保用户提供的就诊数据。[0061]S204,根据预设清洗规则对就诊数据进行清洗。[0062]其中,预设清洗规则是用于对就诊数据进行清洗而制定的规则,可以是删除就诊数据中的内容为空的数据、从就诊数据中提取能够反映投保用户门诊结果的关键词等,如提取医生对于此用户身体状况诊断的关键词,或根据CT光片得到该用户身体状况的关键词;[0063]具体地,服务器根据预设清洗规则清洗就诊数据,如删除就诊数据中内容为空的数据,并提取就诊数据中能够反映投保用户门诊结果的关键词。[0064]S206,将清洗后的就诊数据进行向量化处理生成就诊向量。[0065]就诊向量是服务器利用自然语言处理等方式,将清洗后的就诊数据进行文本向量化处理得到的向量型数据;例如,药物名称的向量等。[0066]具体地,服务器利用向量空间模型将清洗后的就诊数据量化。其中,向量空间模型VSM:VectorSpaceModel,用于把文本内容的处理简化为向量空间中的向量运算,以空间上的相似度表达语义的相似度。[0067]S208,将就诊向量输入医疗坐标模型中得到就诊向量对应的第一治疗数据。[0068]其中,医疗坐标模型是以多名历史投保用户的历史就诊数据为样本数据训练的、能够根据就诊向量得到与就诊向量对应的第一治疗数据的多维坐标模型。[0069]第一治疗数据是根据医疗坐标模型训练的映射关系得到的,就诊向量对应的医疗花费的项目,如药物花费信息、手术花费信息等。[0070]具体地,服务器将就诊向量输入医疗坐标模型后,根据就诊向量上的空间的相似度,将在空间中相近的就诊向量作为医疗坐标模型的同一个输入向量,根据医疗坐标模型中训练的规则获取与就诊向量对应的第一治疗数据,得到此投保申请的医疗花费的项目。[0071]S210,根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用,当诊疗费用大于预设费用时,则将投保申请标记为风险申请。[0072]其中,预设投保时间是衡量投保用户参与投保的风险的时间单元,如可以以一年为预设投保时间,则对于此投保用户提起的投保申请的风险判断都是按照一年为单位进行分析的。预设费用是用于判断投保申请是否有风险的阈值,此预设费用是根据对应的保险产品在预设投保时间内的定价来决定的。[0073]具体地,服务器获取到就诊向量对应的第一治疗数据后,根据其第一治疗数据对应的项目的花费,计算此投保用户在预设的投保时间内的诊疗费用,将诊疗费用与预设费用相比较;当诊疗费用大于预设费用时,则此投保申请被服务器标识成风险申请,需要进一步对系投保申请中的数据进行分析;当诊疗费用小于等于预设费用时,则服务器认为此投保申请不存在风险,可参与投保。[0074]上述投保风险预测方法,根据预设清洗规则对用户终端发送的就诊数据进行清洗,并进行向量化处理生成能够在训练好的医疗坐标模型中表示的就诊向量,通过就诊向量在医疗坐标模型中的位置活动与就诊向量对应的第一治疗数据,即投保用户的就诊数据最可能的治疗方案,以此预测此投保用户的投保风险;上述投保风险预测方法,根据实际的历史投保数据训练的医疗坐标模型,更准确地反映就诊数据和治疗数据之间的关联,能够更准确地预测投保用户的投保风险。[0075]在一个实施例中,上述投保风险预测方法中的步骤S208将就诊向量输入训练好的医疗坐标模型中得到就诊向量对应的第一治疗数据,可以包括:根据就诊向量获取与就诊向量相关的历史用户;获取历史用户的第二治疗数据,并将第二治疗数据作为投保用户第一治疗数据。[0076]其中,历史用户是根据投保申请中的就诊向量的组合得到的与投保用户的状况相似的历史投保用户,如患有同种疾病,且其临床表现相同的投保用户。[0077]第二治疗数据是历史用户对应的医疗花费的项目,如药物花费信息、手术花费信息等。[0078]具体地,在获取投保用户对应的第一治疗数据时,可以根据投保用户提起的投保申请中获得的就诊向量,在医疗坐标模型中寻找到与投保用户对应的历史用户,然后将历史用户的第二治疗数据作为投保用户的第一治疗数据。通常,从一个投保用户对应的投保申请中得到的就诊向量都不止一个,而是多个能够表示此投保用户的健康信息的多个量化的关键词,如疾病名称、患病时间、环境因素、就医偏好等。在训练医疗坐标模型时,可以将同一个历史投保用户对应的多个就诊向量作为一个向量组;而在通过医疗坐标模型得到就诊向量对应的投保数据时,若输入的投保用户的向量组与历史用户的向量组相似,则表示此投保用户与历史用户在投保时间内的医疗花费情况也很可能相似,故可以将历史用户的第二治疗数据作为投保用户的第一治疗数据。[0079]可选地,服务器可以计算投保用户与历史用户的就诊向量之间的相似度,得到投保用户与历史用户的相似度,来衡量此历史用户的第二治疗数据作为投保用户的第一治疗数据的可信度。[0080]上述实施例中,通过医疗坐标模型中寻找与投保用户情况相似的历史用户,以实际的历史治疗数据作为当前的投保用户的治疗数据,能够更准确地对投保用户在未来的医疗花费情况进行预测。[0081]在一个实施例中,上述投保风险预测方法中的步骤S210中的当诊疗费用大于预设费用时,则将投保申请标记为风险申请之后,还包括:根据诊疗费用确定投保申请对应的风险等级;当风险等级未超出预设等级时,则根据诊疗费用计算投保用户的投保价格。[0082]其中,风险等级是当服务器将某一投保申请标记为风险申请后,对此投保申请根据其参保风险的大小进行分级的一种风险管理办法,此风险等级可以包括若干个级别。[0083]预设等级是允许投保用户加价参保的风险等级阈值,可以根据实际情况定义为上述风险等级中的一个级别。[0084]具体地,对于投保申请的风险的衡量,是根据投保用户在预设投保时间内的诊疗费用来确定的。服务器可以根据风险申请的诊疗费用超出预设费用的值对风险申请的投保申请进行量化,以管理风险申请。当风险申请对应的风险等级不超过预设等级,都可以允许投保用户加价参保,服务器根据此投保用户在预设投保时间内的诊疗费用超出预设费用的值,计算得到此投保用户的投保价格,投保用户若同意此投保价格,即可参保。例如,以一年作为预设投保时间,则治疗花费超出预设花费的部分不超过1万的风险申请被定义为一级风险的投保申请,治疗花费超出预设花费的部分大于1万但不超过5万的风险申请被定义为二级风险的投保申请,治疗花费超出预设花费的部分超过5万的风险申请则定义为三级风险的投保申请等等。服务器对于风险等级为二级及以下的风险申请,按照治疗花费超出预设花费的部分计算投保申请的投保价格,推荐投保用户按照得到的投保价格参保。[0085]可选地,上述投保风险预测方法中的根据诊疗费用确定投保申请对应的风险等级之后,还可以包括:当风险等级超出预设等级时,服务器拒绝此投保申请。即当投保申请的风险过高时,则不允许投保用户参保。[0086]上述实施例中,通过风险等级管理投保申请的投保风险,为风险较低的投保申请实行加价参保。[0087]在一个实施例中,上述投保风险预测方法中的步骤S210中的根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用之后,还包括:当诊疗费用不大于预设费用时,则向用户终端发送申请成功的消息;接收用户终端发送的投保指令;根据投保指令进行投保。[0088]其中,投保指令是用户终端发送的投保用户同意投保的指令,可以是投保用户输入的同意投保命令,也可以包含参与投保的合同信息等。[0089]具体地,当服务器计算此投保申请对应的诊疗费用不大于预设费用时,则证明此投保申请无风险,可允许投保用户参保,则服务器向用户终端发送一个申请成功的消息,终端接收到此申请成功的消息后,若用户决定参保,则通过用户终端向服务器发送投保指令,服务器根据此投保指令对投保用户进行投保。[0090]上述实施例中,服务器在判断投保用户的投保申请无风险后,可直接通知投保用户投保,并在投保用户同意后,为其参保。[0091]在一个实施例中,上述投保风险预测方法中的步骤S208将就诊向量输入医疗坐标模型中得到就诊向量对应的第一治疗数据之后,还可以包括:根据第一治疗数据识别投保用户对应的诊疗类型。则获取投保指令,可以包括:根据诊疗类型获取与诊疗类型对应的投保推荐;将投保推荐发送至用户终端;继续接收用户终端发送的投保指令。[0092]其中,诊疗类型为第一治疗数据对应的类型,可以包括短期治疗和长期治疗等。投保推荐为服务器根据诊疗类型给用户推荐的投保方案,如延长参保时间等。[0093]具体地,服务器根据第一治疗数据为投保用户选择合适的保险产品类型,如投保用户患有慢性疾病,则其第一治疗数据可能包含连续几年医疗花费项目,则可为投保用户推荐连续参保几年的保险产品。服务器将这一投保推荐发送给终端后,若用户决定参保,则通过用户终端向服务器发送投保指令,服务器根据此投保指令对投保用户进行投保。[0094]上述实施例中,通过第一治疗数据为投保用户选择合适的保险产品类型,推荐投保用户根据推荐的保险产品类型进行参保。[0095]在一个实施例中,上述投保风险预测方法中的医疗坐标模型的生成方式,可以包括:[0096]S302,获取历史申请,历史申请包括就诊样本和治疗样本。[0097]历史申请是历史投保用户的投保申请中的信息,其中包含历史投保用户的对应的就诊样本和治疗样本,如上一年参与投保的用户提供的信息等。[0098]治疗样本是就诊样本对应的医疗花费的项目,如药物花费信息、手术花费信息等。[0099]具体地,在训练医疗坐标模型时,需要先获取训练模型的数据,即包括就诊样本和治疗样本的历史申请。[0100]S304,从就诊样本和治疗样本中提取预设字段名称,根据所提取的预设字段名称建立多维坐标系。[0101]预设字段名称是用于表示就诊样本和治疗样本情况的字段名称,如与就诊样本相关的疾病名称、临床表现等,与治疗样本相关的药品名称、手术名称等。[0102]具体地,服务器从就诊样本和治疗样本中提取预设字段名称,并建立多维坐标系,用于将预设字段名称在其中进行向量化表示。_[0103]S306,将就诊样本进行向量化处理得到就诊样本向量,对治疗样本进行向量化处理得到治疗样本向量。[0104]具体地,服务器利用向量空间模型将就诊样本量化,生成就诊样本向量;同事也对治疗样本量化得到治疗样本向量。_[0105]S308,根据预设字段名称将就诊样本向量和治疗样本向量绘制在多维坐标系中。[0106]具体地,服务器根据预设字段名称建立就诊样本向量相互之间和治疗样本向量之间的语义联系,根据语义区分多个维度,建立多维坐标系,并将就诊样本向量和治疗样本向量表示在多维坐标系中,语义越相似的就诊样本向量则在多维坐标系中的位置越相近,同样地,语义越相似的就诊样本向量则在多维坐标系中的位置越相近。[0107]S310,根据绘制完成的多维坐标系得到样本点阵,样本点阵用于反映就诊样本向量和治疗样本向量之间相关性。[0108]具体地,在步骤S310中将大量历史投保用户对应的就诊样本向量和治疗样本向量都绘制到多维坐标系中之后,得到的是多个就诊样本向量和治疗样本向量的点阵,语义相似的向量在多维坐标系中表现为聚集的点群。而通过对每一历史投保用户对应的就诊样本向量和治疗样本向量进行分析,在多维坐标中建立相关的就诊样本向量和治疗样本向量之间的映射关系。[0109]S312,获取初始坐标模型,根据样本点阵对初始坐标模型进行训练得到医疗坐标模型。[0110]具体地,初始坐标模型是一空白模型,如神经网络模型等;根据步骤S210中就诊样本向量和治疗样本向量的点阵,以及就诊样本向量和治疗样本向量之间的映射关系对初始坐标模型进行训练,得到医疗坐标模型;此医疗坐标模型能够根据多维坐标系中点阵的关系,获得与输入向量相似的就诊样本向量;也能够根据就诊样本向量和治疗样本向量之间的映射关系,获得与输入向量对应的治疗样本向量。[0111]上述实施例中,采用大量历史投保用户的历史数据训练模型,对投保用户更贴近实际地分析,使得训练出的医疗坐标模型在分析数据时的准确性更高。[0112]在一个实施例中,上述投保风险预测方法还可以包括模型验证方式,该方式可以包括:[0113]S402,获取验证就诊数据和与验证就诊数据对应的验证治疗数据。[0114]其中,验证就诊数据和对应的验证治疗数据用于验证医疗坐标模型的健康数据;服务器可以从历史投保用户的投保申请中的数据中选取一定的比例,作为验证就诊数据和与验证就诊数据对应的验证治疗数据。[0115]具体地,在对医疗坐标模型进行验证时,服务器获取验证就诊数据和与验证就诊数据对应的验证治疗数据。[0116]S404,将验证就诊数据进行向量化处理得到验证就诊向量,将验证就诊向量输入至医疗坐标模型得到模型治疗数据。[0117]具体地,服务器利用向量空间模型将验证就诊数据量化,生成验证就诊向量;再将验证就诊向量输入医疗坐标模型后,根据验证就诊向量上的空间的相似度,将在空间中相近的验证就诊向量作为医疗坐标模型的同一个输入向量,根据医疗坐标模型中训练的规则,获取与验证就诊向量对应的医疗花费的项目,机模型治疗数据。[0118]S406,当验证治疗数据与模型治疗数据的差值大于预设值时,根据验证治疗数据纠正医疗坐标模型。[0119]具体地,将此验证就诊向量对应的验证治疗数据,与根据训练好的医疗坐标模型得到模型治疗数据相比较;当验证治疗数据与模型治疗数据的差值大于预设值时,则根据验证治疗数据纠正医疗坐标模型。[0120]上述实施例中,提供了一直利用历史投保用户的数据,对训练好的医疗坐标模型的验证过程,提高了医疗坐标模型的准确性。[0121]应该理解的是,虽然图2至图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。[0122]在一个实施例中,如图5所示,提供了一种投保风险预测装置,包括:申请接收模块100、清洗模块200、向量化模块300、模型处理模块400和风险分析模块500,其中:[0123]申请接收模块100,用于接收用户终端发送的投保申请,投保申请携带有就诊数据。[0124]清洗模块200,用于根据预设清洗规则对就诊数据进行清洗。[0125]向量化模块300,用于将清洗后的就诊数据进行向量化处理生成就诊向量。[0126]模型处理模块400,用于将就诊向量输入训练好的医疗坐标模型中得到就诊向量对应的第一治疗数据。[0127]风险分析模块500,用于根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用,当诊疗费用大于预设费用时,则将投保申请标记为风险申请。[0128]在一个实施例中,上述投保风险预测装置中的模型处理模块400,还可以包括:[0129]历史比对单元,用于根据就诊向量获取与就诊向量相关的历史用户。[0130]治疗数据匹配单元,用于获取历史用户的第二治疗数据,并将第二治疗数据作为投保用户的第一治疗数据。[0131]在一个实施例中,上述投保风险预测装置,还可以包括:[0132]分级模块,用于根据诊疗费用确定投保申请对应的风险等级。[0133]定价模块,用于当风险等级未超出预设等级时,则根据诊疗费用计算投保用户的投保价格。[0134]在一个实施例中,上述投保风险预测装置,还可以包括:[0135]申请成功通知模块,用于当诊疗费用不大于预设费用时,则向用户终端发送申请成功的消息。[0136]投保指令接收模块,用于接收用户终端发送的投保指令。[0137]投保模块,用于根据投保指令进行投保。[0138]在一个实施例中,上述投保风险预测装置,还可以包括:[0139]诊疗类型识别模块,用于根据第一治疗数据识别投保用户对应的诊疗类型。[0140]则获取投保指令模块,可以包括:[0141]推荐单元,用于根据诊疗类型获取与诊疗类型对应的投保推荐。[0142]推荐发送单元,用于将投保推荐发送至用户终端。[0143]执行单元,用于继续接收用户终端发送的投保指令。[0144]在一个实施例中,上述投保风险预测装置,还可以包括:[0145]历史申请获取模块,用于获取历史申请,历史申请包括就诊样本和治疗样本。[0146]坐标系建立模块,用于从就诊样本和治疗样本中提取预设字段名称,根据所提取的预设字段名称建立多维坐标系。[0147]样本向量化模块,用于将就诊样本进行向量化处理得到就诊样本向量,对治疗样本进行向量化处理得到治疗样本向量。[0148]样本向量表示模块,用于根据预设字段名称将就诊样本向量和治疗样本向量绘制在多维坐标系中。[0149]样本关联模块,用于根据绘制完成的多维坐标系得到样本点阵,样本点矩阵用于反映就诊样本向量和治疗样本向量之间相关性。[0150]模型训练模块,用于获取初始坐标模型,根据样本点阵对初始坐标模型进行训练得到医疗坐标模型。[0151]在一个实施例中,上述投保风险预测装置,还可以包括:[0152]验证数据获取模块,用于获取验证就诊数据和与验证就诊数据对应的验证治疗数据。[0153]模型验证模块,用于将验证就诊数据进行向量化处理得到验证就诊向量,将验证就诊向量输入至医疗坐标模型得到模型治疗数据;[0154]纠正模块,用于当验证治疗数据与模型治疗数据的差值大于预设值时,根据验证治疗数据纠正医疗坐标模型。[0155]关于投保风险预测装置的具体限定可以参见上文中对于投保风险预测方法的限定,在此不再赘述。上述投保风险预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。[0156]在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储投保风险预测数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种投保风险预测方法。[0157]本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置[0158]在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收用户终端发送的投保申请,投保申请携带有就诊数据;根据预设清洗规则对就诊数据进行清洗;将清洗后的就诊数据进行向量化处理生成就诊向量;将就诊向量输入医疗坐标模型中得到就诊向量对应的第一治疗数据;根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用,当诊疗费用大于预设费用时,则将投保申请标记为风险申请。[0159]在一个实施例中,处理器执行计算机程序时实现的将就诊向量输入训练好的医疗坐标模型中得到就诊向量对应的第一治疗数据,可以包括:根据就诊向量获取与就诊向量相关的历史用户;获取历史用户的第二治疗数据,并将第二治疗数据作为投保用户的第一治疗数据。[0160]在一个实施例中,处理器执行计算机程序时实现的诊疗费用大于预设费用时,则将投保申请标记为风险申请之后,还可以包括:根据诊疗费用确定投保申请对应的风险等级;当风险等级未超出预设等级时,则根据诊疗费用计算投保用户的投保价格。[0161]在一个实施例中,处理器执行计算机程序时实现的根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用之后,还可以包括:当诊疗费用不大于预设费用时,则向用户终端发送申请成功的消息;接收用户终端发送的投保指令;根据投保指令进行投保。[0162]在一个实施例中,处理器执行计算机程序时实现的将就诊向量输入医疗坐标模型中得到就诊向量对应的第一治疗数据之后,还可以包括:根据第一治疗数据识别投保用户对应的诊疗类型。则处理器执行计算机程序时实现的获取投保指令,可以包括:根据诊疗类型获取与诊疗类型对应的投保推荐;将投保推荐发送至用户终端;继续接收用户终端发送的投保指令。[0163]在一个实施例中,处理器执行计算机程序时实现的投保风险预测方法,可以包括医疗坐标模型的生成方式,该方式包括:获取历史申请,历史申请包括就诊样本和治疗样本;从就诊样本和治疗样本中提取预设字段名称,根据所提取的预设字段名称建立多维坐标系;将就诊样本进行向量化处理得到就诊样本向量,对治疗样本进行向量化处理得到治疗样本向量;根据预设字段名称将就诊样本向量和治疗样本向量绘制在多维坐标系中;根据绘制完成的多维坐标系得到样本点阵,样本点矩阵用于反映就诊样本向量和治疗样本向量之间相关性;获取初始坐标模型,根据样本点阵对初始坐标模型进行训练得到医疗坐标模型。[0164]在一个实施例中,处理器执行计算机程序时实现的投保风险预测方法,还可以包括:获取验证就诊数据和与验证就诊数据对应的验证治疗数据;将验证就诊数据进行向量化处理得到验证就诊向量,将验证就诊向量输入至医疗坐标模型得到模型治疗数据;当验证治疗数据与模型治疗数据的差值大于预设值时,根据验证治疗数据纠正医疗坐标模型。[0165]在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收用户终端发送的投保申请,投保申请携带有就诊数据;根据预设清洗规则对就诊数据进行清洗;将清洗后的就诊数据进行向量化处理生成就诊向量;将就诊向量输入医疗坐标模型中得到就诊向量对应的第一治疗数据;根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用,当诊疗费用大于预设费用时,则将投保申请标记为风险申请。[0166]在一个实施例中,计算机程序被处理器执行时实现的将就诊向量输入训练好的医疗坐标模型中得到就诊向量对应的第一治疗数据,可以包括:根据就诊向量获取与就诊向量相关的历史用户;获取历史用户的第二治疗数据,并将第二治疗数据作为投保用户的第一治疗数据。[0167]在一个实施例中,计算机程序被处理器执行时实现的诊疗费用大于预设费用时,则将投保申请标记为风险申请之后,还可以包括:根据诊疗费用确定投保申请对应的风险等级;当风险等级未超出预设等级时,则根据诊疗费用计算投保用户的投保价格。[0168]在一个实施例中,计算机程序被处理器执行时实现的根据第一治疗数据计算投保用户在预设投保时间内的诊疗费用之后,还可以包括:当诊疗费用不大于预设费用时,则向用户终端发送申请成功的消息;接收用户终端发送的投保指令;根据投保指令进行投保。[0169]在一个实施例中,计算机程序被处理器执行时实现的将就诊向量输入医疗坐标模型中得到就诊向量对应的第一治疗数据之后,还可以包括:根据第一治疗数据识别投保用户对应的诊疗类型。则处理器执行计算机程序时实现的获取投保指令,可以包括:根据诊疗类型获取与诊疗类型对应的投保推荐;将投保推荐发送至用户终端;继续接收用户终端发送的投保指令。[0170]在一个实施例中,计算机程序被处理器执行时实现的投保风险预测方法,可以包括医疗坐标模型的生成方式,该方式包括:获取历史申请,历史申请包括就诊样本和治疗样本;从就诊样本和治疗样本中提取预设字段名称,根据所提取的预设字段名称建立多维坐标系;将就诊样本进行向量化处理得到就诊样本向量,对治疗样本进行向量化处理得到治疗样本向量;根据预设字段名称将就诊样本向量和治疗样本向量绘制在多维坐标系中;根据绘制完成的多维坐标系得到样本点阵,样本点矩阵用于反映就诊样本向量和治疗样本向量之间相关性;获取初始坐标模型,根据样本点阵对初始坐标模型进行训练得到医疗坐标模型。[0171]在一个实施例中,计算机程序被处理器执行时实现的投保风险预测方法,还可以包括:获取验证就诊数据和与验证就诊数据对应的验证治疗数据;将验证就诊数据进行向量化处理得到验证就诊向量,将验证就诊向量输入至医疗坐标模型得到模型治疗数据;当验证治疗数据与模型治疗数据的差值大于预设值时,根据验证治疗数据纠正医疗坐标模型。[0172]本领域普通技术人员可以理解实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和或易失性存储器。非易失性存储器可包括只读存储器R0M、可编程ROMPR0M、电可编程ROMEPROM、电可擦除可编程ROMEEPR0M或闪存。易失性存储器可包括随机存取存储器RAM或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAMSRAM、动态RAMDRAM、同步DRAMSDRAM、双数据率SDRAMDDRSDRAM、增强型SDRAMESDRAM、同步链路(SynchlinkDRAMSLDRAM、存储器总线(Rambus直接RAMRDRAM、直接存储器总线动态ramDRDRAM、以及存储器总线动态RAMRDRAM等。[0173]以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。[0174]以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

权利要求:1.一种投保风险预测方法,所述方法包括:接收用户终端发送的投保申请,所述投保申请携带有就诊数据;根据预设清洗规则对所述就诊数据进行清洗;将清洗后的所述就诊数据进行向量化处理生成就诊向量;将所述就诊向量输入医疗坐标模型中得到所述就诊向量对应的第一治疗数据;根据所述第一治疗数据计算所述投保用户在预设投保时间内的诊疗费用,当所述诊疗费用大于预设费用时,则将所述投保申请标记为风险申请。2.根据权利要求1所述的方法,其特征在于,所述将所述就诊向量输入训练好的医疗坐标模型中得到所述就诊向量对应的第一治疗数据,包括:根据所述就诊向量获取与所述就诊向量相关的历史用户;获取所述历史用户的第二治疗数据,并将所述第二治疗数据作为所述投保用户的所述第一治疗数据。3.根据权利要求1所述的方法,其特征在于,所述当所述诊疗费用大于预设费用时,则将所述投保申请标记为风险申请之后,还包括:根据所述诊疗费用确定所述投保申请对应的风险等级;当所述风险等级未超出预设等级时,则根据所述诊疗费用计算所述投保用户的投保价格。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一治疗数据计算所述投保用户在预设投保时间内的诊疗费用之后,还包括:当所述诊疗费用不大于预设费用时,则向所述用户终端发送申请成功的消息;接收所述用户终端发送的投保指令;根据所述投保指令进行投保。5.根据权利要求4所述的方法,其特征在于,所述将所述就诊向量输入医疗坐标模型中得到所述就诊向量对应的第一治疗数据之后,还包括:根据所述第一治疗数据识别所述投保用户对应的诊疗类型;所述获取投保指令,包括:根据所述诊疗类型获取与所述诊疗类型对应的投保推荐;将所述投保推荐发送至所述用户终端;继续接收所述用户终端发送的投保指令。_6.根据权利要求1所述的方法,其特征在于,所述医疗坐标模型的生成方式,包括:获取历史申请,所述历史申请包括就诊样本和治疗样本;、从所述就诊样本和治疗样本中提取预设字段名称,根据所提取的预设字段名称建立多维坐标系;_将所述就诊样本进行向量化处理得到就诊样本向量,对所述治疗样本进行向量化处理得到治疗样本向量;、、、,根据所述预设字段名称将所述就诊样本向量和所述治疗样本向量绘制在所述多维坐标系中;'根据绘制完成的多维坐标系得到样本点阵,所述样本点矩阵用于反映所述就诊样本向量和所述治疗样本向量之间相关性;获取初始坐标模型,根据所述样本点阵对所述初始坐标模型进行训练得到医疗坐标模型。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取验证就诊数据和与验证就诊数据对应的验证治疗数据;将所述验证就诊数据进行向量化处理得到验证就诊向量,将所述验证就诊向量输入至所述医疗坐标模型得到模型治疗数据;当所述验证治疗数据与所述模型治疗数据的差值大于预设值时,根据所述验证治疗数据纠正所述医疗坐标模型。8.—种投保风险预测装置,其特征在于,所述装置包括:申请接收模块,用于接收用户终端发送的投保申请,所述投保申请携带有就诊数据;清洗模块,用于根据预设清洗规则对所述就诊数据进行清洗;向量化模块,用于将清洗后的所述就诊数据进行向量化处理生成就诊向量;模型处理模块,用于将所述就诊向量输入训练好的医疗坐标模型中得到所述就诊向量对应的第一治疗数据;风险分析模块,用于根据所述第一治疗数据计算所述投保用户在预设投保时间内的诊疗费用,当所述诊疗费用大于预设费用时,则将所述投保申请标记为风险申请。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。10.—种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

百度查询: 平安科技(深圳)有限公司 投保风险预测方法、装置、计算机设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。