首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

车险的出险情况的预测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海赢科信息技术有限公司

摘要:本发明公开了一种车险的出险情况的预测方法及系统,其中,车险的出险情况的预测方法包括:获取若干份第一历史保单数据和对应的历史出险结果;根据第一历史保单数据和历史出险结果计算每份第一历史保单数据的权重;将权重和第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,车险出险预测模型的输出参数包括预测出险结果;将待预测保单数据输入至车险出险预测模型以预测待预测保单数据是否出险的预测出险结果。本发明将传统的车险预测模型与传统方法预测模型相比,提升度上有很大的提升。

主权项:1.一种车险的出险情况的预测方法,其特征在于,所述车险的出险情况的预测方法包括:获取若干份第一历史保单数据和对应的历史出险结果;根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重;将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,所述车险出险预测模型的输出参数包括预测出险结果;将待预测保单数据输入至所述车险出险预测模型以预测所述待预测保单数据是否出险的预测出险结果;所述车险出险预测模型的输出参数还包括打分值;所述根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重的步骤包括:采用至少两种预设计算方法计算并得到所述权重;将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型的步骤包括:将每种预设计算方法计算得到的权重分别和所述第一历史保单数据作为输入,得到分别对应的车险出险预测模型作为待选的车险出险预测模型;将若干份第二历史保单数据均分别输入至所述待选的车险出险预测模型分别得到对应的预测出险结果和打分值;根据所述打分值和所述第二历史保单数据对应的历史出险结果计算所述车险出险预测模型的提升度,选用所述待选的车险出险预测模型中所述提升度最高的模型作为最终的车险出险预测模型;所述提升度用于表征与出险次数、金额或赔付率相关联的模型评价参数;所述预设计算方法为: 其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,α是限制参数,在一预设阈值范围内;和或, 其中,weight2为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数;和或, 其中,weight3为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数。

全文数据:车险的出险情况的预测方法及系统技术领域本发明涉及数据处理领域,尤其涉及一种车险的出险情况预测方法及系统。背景技术传统的车险预测模型在训练阶段,通常将每辆车每年的出险次数、出险金额或赔付率作为目标变量,用其他因素车型、车价、地域、险种、购买保险前的驾驶特征,历史出险情况等等通过有监督类算法来拟合这些目标值。但是车辆的出险情况既有驾驶习惯、路况等因素导致的必然性,同时也伴随着偶然性。这是因为即使是相同的驾驶行为,其最终的出险次数也不可能完全相同;即使出险次数相同,因为不同类型的事故,事故车辆的撞击部位以及损伤情况也会不同,导致不同的赔付金额和赔付率。所以,传统车险建模过程中的目标选择方式使得目标变量中的偶然性因素主导了模型的生成,模型无法从输入特征中定位出真正的风险因素,也就导致了容易过拟合等问题的发生,最终导致车险预测模型在实际上线后的应用过程中预测不准确的后果。发明内容本发明要解决的技术问题是为了克服现有技术中车险预测模型预测不准确的缺陷,提供一种车险的出险情况预测方法及系统。本发明是通过以下技术方案解决上述技术问题的:一种车险的出险情况的预测方法,所述车险的出险情况的预测方法包括:获取若干份第一历史保单数据和对应的历史出险结果;根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重;将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,所述车险出险预测模型的输出参数包括预测出险结果;将待预测保单数据输入至所述车险出险预测模型以预测所述待预测保单数据是否出险的预测出险结果。较佳地,所述车险出险预测模型的输出参数还包括打分值;所述根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重的步骤包括:采用至少两种预设计算方法计算并得到所述权重;将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型的步骤包括:将每种预设计算方法计算得到的权重分别和所述第一历史保单数据作为输入,得到分别对应的车险出险预测模型作为待选的车险出险预测模型;将若干份第二历史保单数据均分别输入至待选的车险出险预测模型分别得到对应的预测出险结果和打分值;根据打分值和第二历史保单数据对应的历史出险结果计算车险出险预测模型的提升度,选用待选的车险出险预测模型中提升度最高的模型作为最终的车险出险预测模型较佳地,所述预设计算方法为:其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,α是限制参数,在一预设阈值范围内;和或,其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数;和或,其中,weight3为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数。较佳地,在所述将待预测保单数据输入至所述车险出险预测模型以预测所述待预测保单数据是否出险的预测出险结果的步骤之后,所述车险的出险情况的预测方法还包括:判断所述车险出险预测模型的使用时间是否超过预设期限,若是,则返回所述获取若干份第一历史保单数据和对应的历史出险结果的步骤。较佳地,所述第一历史保单数据和或第二历史保单数据包括车主信息、车辆信息、保险信息。一种车险的出险情况的预测系统,所述车险的出险情况的预测系统包括采集模块、权重计算模块、训练模块和预测模块;所述采集模块用于获取若干份第一历史保单数据和对应的历史出险结果;所述权重计算模块用于根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重;所述训练模块用于将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,所述车险出险预测模型的输出参数包括预测出险结果;所述预测模块用于将待预测保单数据输入至所述车险出险预测模型以预测所述待预测保单数据是否出险的预测出险结果。较佳地,所述车险出险预测模型的输出参数还包括打分值;所述权重计算模块还用于采用至少两种预设计算方法计算并得到所述权重;所述训练模块还用于将每种预设计算方法计算得到的权重分别和所述第一历史保单数据作为输入,得到分别对应的车险出险预测模型作为待选的车险出险预测模型;所述训练模块还用于将若干份第二历史保单数据均分别输入至所述待选的车险出险预测模型分别得到对应的预测出险结果和打分值;根据所述打分值和所述第二历史保单数据对应的历史出险结果计算所述车险出险预测模型的提升度,选用所述待选的车险出险预测模型中所述提升度最高的模型作为最终的车险出险预测模型较佳地,所述预设计算方法为:其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,α是限制参数,在一预设阈值范围内;和或,其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数;和或,其中,weight3为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数。较佳地,所述车险的出险情况的预测系统还包括更新模块,所述更新模块用于判断所述车险出险预测模型的使用时间是否超过预设期限,若是,则调用所述采集模块。较佳地,所述第一历史保单数据和或第二历史保单数据包括车主信息、车辆信息、保险信息。本发明的积极进步效果在于:本发明将传统的车险预测模型预测的目标为出险次数、金额、赔付率等连续值的方式,改变为预测是否出险的二分类方式,利用历史保单数据以及对应的权重作为输入训练得到的车险出险预测模型,车险出险预测模型的提升度与传统方法预测模型的提升度相比,有很大的提升。附图说明图1为本发明的实施例1的车险的出险情况的预测方法的流程示意图。图2为本发明的实施例2的车险的出险情况的预测方法的步骤103的流程示意图。图3为本发明的实施例2的车险的出险情况的预测方法的流程示意图。图4为本发明的实施例3的车险的出险情况的预测系统的模块图。图5为本发明的实施例4的车险的出险情况的预测系统的模块图。具体实施方式下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。实施例1本实施例提供一种车险的出险情况的预测方法,如图1所示,车险的出险情况的预测方法包括:步骤101、获取若干份第一历史保单数据和对应的历史出险结果。出险结果通常包括出险次数、赔付金额和赔付率等。步骤102、根据第一历史保单数据和历史出险结果计算每份第一历史保单数据的权重。步骤103、将权重和第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,车险出险预测模型的输出参数包括预测出险结果。在本实施例中,在进行模型训练时,每条训练数据即对应一张保单,第一保单数据假如包括的是对应某辆车在某一年的情况。若当年该车出过险,无论次数和金额是多少,都将出险结果的目标变量设为1,即出过险;如果没有出过险,则设为0,即未出过险。即目标变量为是否出险,以01表示。步骤104、将待预测保单数据输入至车险出险预测模型以预测待预测保单数据是否出险的预测出险结果。本实施例将传统预测模型采用预测出险次数、金额等连续值的方式转变为预测是否出险的二分类问题,解决了原方式中车辆、驾驶等风险因素的不同必然会导致出险次数和金额截然不同的预测结果,将传统的车险预测模型预测的目标为出险次数金额赔付率等连续值的方式,改变为预测是否出险的二分类方式,利用历史保单数据以及对应的权重作为输入训练得到的车险出险预测模型,车险出险预测模型的提升与传统方法预测模型的提升度相比,有很大的提升。实施例2本实施例提供的车险的出险情况的预测方法,与实施例1相比,区别在于,所述车险出险预测模型的输出参数还包括打分值;步骤102包括:采用至少两种预设计算方法计算并得到权重。保单的出险结果中通常包括出险次数、出险金额和赔付率、赔付的年化比例等。本实施例中,选用的预设计算方法为:其中,weight1为权重,claimcnti为出险次数,ri为年化比例,α是限制参数,在一预设阈值范围内;和或,其中,weight1为权重,claimcnti为出险次数,ri为年化比例,β是开方的参数;和或,其中,weight3为权重,claimcnti为出险次数,ri为年化比例,β是开方的参数。对应的,步骤103包括:1031、将每种预设计算方法计算得到的权重分别和第一保单数据作为输入,得到分别对应的车险出险预测模型作为待选的车险出险预测模型。通常保单数据均包括车主信息、车辆信息、保险信息。1032、将若干份第二历史保单数据均分别输入至待选的车险出险预测模型分别得到对应的预测出险结果和打分值,根据打分值和第二历史保单数据对应的历史出险结果计算车险出险预测模型的提升度,所述待选的车险出险预测模型中所述提升度最高的模型作为最终的车险出险预测模型。车险的出险情况的预测方法还包括:步骤105、判断车险出险预测模型的使用时间是否超过预设期限,若是,则返回步骤101。在车险出险预测模型进行上线使用后,由于外在各种环境的改变,可定期对车险出险预测模型进行样本更新训练,以随时优化出险预测模型的预测准确度。在本实施例中,采集若干份历史保单数据,将这些历史保单数据分成三份,一部分作为训练数据集即第一历史数据,一部分作为验证数据集,即第二历史数据,一部分作为测试数据集,用来测试车险出险预测模型的提升效果,三部分数据可以以5:3:2的比例随机分割。本实施例的二分类算法,可选用随机森林,GBDT,深度神经网络等二分类模型,将是否出险01作为其目标变量,利用上述三种计算方法计算出的权重分别作为模型的输入weight权重参数,在训练数据集上进行训练,并分别得到对应的车险出险预测模型,之后在验证集上进行打分,即,将验证数据集按模型打分从高到低排序后,等分为10份,计算各份中对应的历史出险结果中出险次数、金额或是赔付率的平均值,并将每分段中最高分除以最低分得到对应值,即分别得到出险次数、金额或是赔付率的预测提升度,根据实际应用,可选用合适的预测提升度对应的车险出险预测模型作为最优的车险出险预测模型进行上线使用。经过本实施例的方法训练得到的车险出险预测模型,与传统的预测模型相比,其预测准确提升的效果可使用提升度来评估,通常传统方法得到的提升度在2左右,本实施例的方法提升度在3左右,提升50%。实施例3本实施例提供一种车险的出险情况的预测系统,如图4所示,车险的出险情况的预测系统包括采集模块201、权重计算模块202、训练模块203和预测模块204。采集模块201用于获取若干份第一历史保单数据和对应的历史出险结果;出险结果通常包括出险次数、赔付金额和赔付率等。权重计算模块202用于根据第一历史保单数据和历史出险结果计算每份第一历史保单数据的权重;训练模块203用于将权重和第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,车险出险预测模型的输出参数包括预测出险结果;在本实施例中,在进行模型训练时,每条训练数据即对应一张保单,第一保单数据假如包括的是对应某辆车在某一年的情况。若当年该车出过险,无论次数和金额是多少,都将出险结果的目标变量设为1,即出过险;如果没有出过险,则设为0,即未出过险。即目标变量为是否出险,以01表示。预测模块204用于将待预测保单数据输入至车险出险预测模型以预测待预测保单数据是否出险的预测出险结果。本实施例将传统预测模型采用预测出险次数、金额等连续值的方式转变为预测是否出险的二分类问题,解决了原方式中车辆、驾驶等风险因素的不同必然会导致出险次数和金额截然不同的预测结果,将传统的车险预测模型预测的目标为出险次数金额赔付率等连续值的方式,改变为预测是否出险的二分类方式,利用历史保单数据以及对应的权重作为输入训练得到的车险出险预测模型,车险出险预测模型的提升与传统方法预测模型的提升度相比,有很大的提升。实施例4本实施例提供一种,本实施例与实施例3相比,其区别在于,所述车险出险预测模型的输出参数还包括打分值。权重计算模块202还用于采用至少两种预设计算方法计算并得到权重。保单的出险结果中通常包括出险次数、出险金额和赔付率、赔付的年化比例等。本实施例中,选用的预设计算方法为:其中,weight1为权重,claimcnti为出险次数,ri为年化比例,α是限制参数,在一预设阈值范围内;和或,其中,weight1为权重,claimcnti为出险次数,ri为年化比例,β是开方的参数;和或,其中,weight3为权重,claimcnti为出险次数,ri为年化比例,β是开方的参数。训练模块203还用于将每种预设计算方法计算得到的权重分别和第一历史保单数据作为输入,得到分别对应的车险出险预测模型作为待选的车险出险预测模型;训练模块203还用于将若干份第二历史保单数据均分别输入至所述待选的车险出险预测模型分别得到对应的预测出险结果和打分值,根据所述打分值和所述第二历史保单数据对应的历史出险结果计算所述车险出险预测模型的提升度,选用所述待选的车险出险预测模型中中所述提升度最的模型作为最终的车险出险预测模型。车险的出险情况的预测系统还包括更新模块205,更新模块用于判断车险出险预测模型的使用时间是否超过预设期限,若是,则调用采集模块。在车险出险预测模型进行上线使用后,由于外在各种环境的改变,可定期对车险出险预测模型进行样本更新训练,以随时优化出险预测模型的预测准确度。在本实施例中,采集若干份历史保单数据,将这些历史保单数据分成三份,一部分作为训练数据集即第一历史数据,一部分作为验证数据集,即第二历史数据,一部分作为测试数据集,用来测试车险出险预测模型的提升效果,三部分数据可以以5:3:2的比例随机分割。本实施例的二分类算法,可选用随机森林,GBDT,深度神经网络等二分类模型,将是否出险01作为其目标变量,利用上述三种计算方法计算出的权重分别作为模型的输入weight权重参数,在训练数据集上进行训练,并分别得到对应的车险出险预测模型,之后在验证集上进行打分,即,将验证数据集按模型打分从高到低排序后,等分为10份,计算各份中对应的历史出险结果中出险次数、金额或是赔付率的平均值,并将每分段中最高分除以最低分得到对应值,即分别得到出险次数、金额或是赔付率的预测提升度,根据实际应用,可选用合适的预测提升度对应的车险出险预测模型作为最优的车险出险预测模型进行上线使用。经过本实施例的系统训练得到的车险出险预测模型,与传统的预测模型相比,其预测准确提升的效果可使用提升度来评估,通常传统方法得到的提升度在2左右,本实施例的方法提升度在3左右,提升50%。虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

权利要求:1.一种车险的出险情况的预测方法,其特征在于,所述车险的出险情况的预测方法包括:获取若干份第一历史保单数据和对应的历史出险结果;根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重;将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,所述车险出险预测模型的输出参数包括预测出险结果;将待预测保单数据输入至所述车险出险预测模型以预测所述待预测保单数据是否出险的预测出险结果。2.如权利要求1所述的车险的出险情况的预测方法,其特征在于,所述车险出险预测模型的输出参数还包括打分值;所述根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重的步骤包括:采用至少两种预设计算方法计算并得到所述权重;将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型的步骤包括:将每种预设计算方法计算得到的权重分别和所述第一历史保单数据作为输入,得到分别对应的车险出险预测模型作为待选的车险出险预测模型;将若干份第二历史保单数据均分别输入至所述待选的车险出险预测模型分别得到对应的预测出险结果和打分值;根据所述打分值和所述第二历史保单数据对应的历史出险结果计算所述车险出险预测模型的提升度,选用所述待选的车险出险预测模型中所述提升度最高的模型作为最终的车险出险预测模型。3.如权利要求2所述的车险的出险情况的预测方法,其特征在于,所述预设计算方法为:其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,α是限制参数,在一预设阈值范围内;和或,其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数;和或,其中,weight3为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数。4.如权利要求1所述的车险的出险情况的预测方法,其特征在于,在所述将待预测保单数据输入至所述车险出险预测模型以预测所述待预测保单数据是否出险的预测出险结果的步骤之后,所述车险的出险情况的预测方法还包括:判断所述车险出险预测模型的使用时间是否超过预设期限,若是,则返回所述获取若干份第一历史保单数据和对应的历史出险结果的步骤。5.如权利要求1所述的车险的出险情况的预测方法,其特征在于,所述第一历史保单数据和或第二历史保单数据包括车主信息、车辆信息、保险信息。6.一种车险的出险情况的预测系统,其特征在于,所述车险的出险情况的预测系统包括采集模块、权重计算模块、训练模块和预测模块;所述采集模块用于获取若干份第一历史保单数据和对应的历史出险结果;所述权重计算模块用于根据所述第一历史保单数据和所述历史出险结果计算每份所述第一历史保单数据的权重;所述训练模块用于将所述权重和所述第一历史保单数据输入二分类模型进行训练,得到车险出险预测模型,所述车险出险预测模型的输出参数包括预测出险结果;所述预测模块用于将待预测保单数据输入至所述车险出险预测模型以预测所述待预测保单数据是否出险的预测出险结果。7.如权利要求6所述的车险的出险情况的预测系统,其特征在于,所述车险出险预测模型的输出参数还包括打分值;所述权重计算模块还用于采用至少两种预设计算方法计算并得到所述权重;所述训练模块还用于将每种预设计算方法计算得到的权重分别和所述第一历史保单数据作为输入,得到分别对应的车险出险预测模型作为待选的车险出险预测模型;所述训练模块还用于将若干份第二历史保单数据均分别输入至所述待选的车险出险预测模型分别得到对应的预测出险结果和打分值,根据所述打分值和所述第二历史保单数据对应的历史出险结果计算所述车险出险预测模型的提升度,选用所述待选的车险出险预测模型中中所述提升度最的模型作为最终的车险出险预测模型。8.如权利要求7所述的车险的出险情况的预测系统,其特征在于,所述预设计算方法为:其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,α是限制参数,在一预设阈值范围内;和或,其中,weight1为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数;和或,其中,weight3为所述权重,claimcnti为出险次数,ri为年化比例,β是开方的参数。9.如权利要求6所述的车险的出险情况的预测系统,其特征在于,所述车险的出险情况的预测系统还包括更新模块,所述更新模块用于判断所述车险出险预测模型的使用时间是否超过预设期限,若是,则调用所述采集模块。10.如权利要求6所述的车险的出险情况的预测系统,其特征在于,所述第一历史保单数据和或第二历史保单数据包括车主信息、车辆信息、保险信息。

百度查询: 上海赢科信息技术有限公司 车险的出险情况的预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。