首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

保单续期收费难度预测方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明提出了一种保单续期收费难度预测方法,所述方法包括:获取预设时间内的保单信息,根据保单信息中的保单续期缴费记录将保单在宽限期内是否续期缴费作为目标变量,提取所有可能影响该目标变量的特征因素,计算提取的每个特征因素对目标变量的影响度,筛选出影响目标变量的目标特征因素,根据目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。该方法可以提前对待续期缴费的保单进行续收难度识别,便于后续有针对性的干预。此外,还提出了一种保单续期收费难度预测装置。

主权项:一种保单续期收费难度预测方法,所述方法包括:获取预设时间段内的保单信息,所述保单信息包括保单续期缴费信息;根据所述保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从所述保单信息中提取所有可能影响该目标变量的特征因素;计算提取的每个特征因素对所述目标变量的影响度,根据所述影响度的大小筛选出影响所述目标变量的目标特征因素;根据所述目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。

全文数据:保单续期收费难度预测方法和装置技术领域[0001]本发明涉及计算机处理领域,特别是涉及一种保单续期收费难度预测方法和装置。背景技术[0002]随着保险行业的发展,越来越多的人都已经进行了各种各样的投保,而且很多保单都是长期的,需要客户定期进行续期缴费。保险公司每个月都有大量保单需要续期缴费,而业务人员需要对该续期缴费的保单进行续期催收,但是不同客户对于保单续期缴费的意愿不同,导致保单续期收费难度有难有易,常常由于无法提前识别不同续收难度的保单,导致无法有针对性的调控人力,造成人员资金的浪费,而且也不利于提高续期收费达成率。因此,亟待需要一种能够预测保单续期收费难度的方法。发明内容[0003]基于此,有必要针对上述问题,提出一种能够准确预测保单续期收费难度的保单续期收费难度预测方法和装置。[0004]—种保单续期收费难度预测方法,所述方法包括:获取预设时间段内的保单信息,所述保单信息包括保单续期缴费信息;根据所述保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从所述保单信息中提取所有可能影响该目标变量的特征因素;计算提取的每个特征因素对所述目标变量的影响度,根据所述影响度的大小筛选出影响所述目标变量的目标特征因素;根据所述目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值;[0005]在其中一个实施例中,所述续期收费难度识别模型用于预测目标保单的续收难度值的步骤包括:获取待预测的目标保单数据,根据所述续期收费难度识别模型计算与目标保单对应的续收难度概率值;根据计算得到的所述续收难度概率值确定与所述目标保单对应的续收难度值。[0006]在其中一个实施例中,所述计算提取的每个特征因素对所述目标变量的影响度,根据所述影响度的大小筛选出影响所述目标变量的目标特征因素的步骤包括:计算每个特征因素对所述目标变量的影响权重;根据所述影响权重计算得到每个特征因素对应的影响度;根据所述影响度的大小筛选出对所述目标变量有影响的目标特征因素。[0007]在其中一个实施例中,所述根据所述目标特征因素建立保单续期收费难度识别模型的步骤包括:将所述目标特征因素作为入模变量建立逻辑回归模型;将获取的所述预设时间段内的保单信息作为所述逻辑回归模型的训练数据,通过训练学习得到保单续期收费难度识别模型。[0008]在其中一个实施例中,在所述根据所述目标特征因素建立续期收费难度识别模型的步骤之前还包括:采用逐步回归的方法从所述目标特征因素中查找出引起多重共线性的因素;将查找到的引起多重共线性的因素从所述目标特征因素中删除。[0009]一种保单续期收费难度预测装置,所述装置包括:获取模块,用于获取预设时间段内的保单信息,所述保单信息包括保单续期缴费信息;提取模块,用于根据所述保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从所述保单信息中提取所有可能影响该目标变量的特征因素;筛选模块,用于计算提取的每个特征因素对所述目标变量的影响度,根据所述影响度的大小筛选出影响所述目标变量的目标特征因素;建立模块,用于根据所述目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。[0010]在其中一个实施例中,所述装置还包括:计算模块,用于获取待预测的目标保单数据,根据所述续期收费难度识别模型计算与目标保单对应的续收难度概率值;确定模块,用于根据计算得到的所述续收难度概率值确定与所述目标保单对应的续收难度值。[0011]在其中一个实施例中,所述筛选模块包括:权重计算模块,用于计算每个特征因素对所述目标变量的影响权重;影响度计算模块,用于根据所述影响权重计算得到每个特征因素对应的影响度;因素筛选模块,用于根据所述影响度的大小筛选出对所述目标变量有影响的目标特征因素。[0012]在其中一个实施例中,所述建立模块包括:模型建立模块,用于将所述目标特征因素作为入模变量建立逻辑回归模型;训练学习模块,用于将获取的所述预设时间段内的保单信息作为所述逻辑回归模型的训练数据,通过训练学习得到保单续期收费难度识别模型。[0013]在其中一个实施例中,所述装置还包括:查找模块,用于采用逐步回归的方法从所述目标特征因素中查找出引起多重共线性的因素;删除模块,用于将查找到的引起多重共线性的因素从所述目标特征因素中删除。[0014]上述保单续期收费难度预测方法和装置,通过获取预设时间内的保单信息,根据保单信息中的保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从保单信息中提取所有可能影响该目标变量的特征因素,计算提取的每个特征因素对目标变量的影响度,根据影响度的大小筛选出影响目标变量的目标特征因素,根据目标特征因素建立续期收费难度识别模型,根据续期收费难度识别模型对目标保单的续收难度值进行预测。该方法根据已有保单的信息从中筛选出对保单续期缴费有影响的目标特征因素,根据该目标特征因素建立了续期收费难度识别模型,然后根据该续期收费难度识别模型可以预测目标保单的续收难度值,这样便于后续根据目标保单的续收难度值进行针对性的干预,实现人力的合理调配,节省人力物力,而且有利于提高续期达成率。附图说明[0015]图1为一个实施例中终端的内部结构示意图;[0016]图2为一个实施例中服务器的内部结构示意图;[0017]图3为一个实施例中保单续期收费难度预测方法流程图;[0018]图4为一个实施例中计算提取的每个特征因素对目标变量的影响度的方法流程图;[0019]图5为一个实施例中根据目标特征因素建立续期收费难度识别模型的方法流程图;[0020]图6为另一个实施例中保单续期收费难度预测方法流程图;[0021]图7为一个实施例中保单续期收费难度预测装置的结构框图;[0022]图8为一个实施例中筛选模块的结构框图;[0023]图9为一个实施例中建立模块的结构框图;[0024]图10为另一个实施例中保单续期收费难度预测装置的结构框图。具体实施方式[0025]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。[0026]如图1所示,在一个实施例中,终端102的内部结构如图1所示,包括通过系统总线连接的处理器、内存储器、非易失性存储介质、网络接口、显示屏和输入装置。其中,终端102的非易失性存储介质存储有操作系统,还包括一种保单续期收费难度预测装置,该保单续期收费难度预测装置用于实现一种保单续期收费难度预测方法。该处理器用于提供计算和控制能力,支撑整个终端的运行。终端中的内存储器为非易失性存储介质中的保单续期收费难度预测装置的运行提供环境,该内存储器中存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种保单续期收费难度预测方法。网络接口用于连接到网络进行通信。终端102的显示屏可以是液晶显示屏或者电子墨水显示屏等,输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,也可以是外接的键盘、触控板或鼠标等。该终端可以是平板电脑、笔记本电脑、台式计算机等。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的终端的限定,具体的移动终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。[0027]如图2所示,在一个实施例中,服务器104的内部结构如图2所示,包括通过系统总线连接的处理器、非易失性存储介质、内存和网络接口。其中,该非易失存储介质包括操作系统、数据库、保单续期收费难度预测装置。数据库用于存储数据。该保单续期收费难度预测装置用于实现一种保单续期收费难度预测方法,该服务器的处理器用于提供计算和控制能力,支撑整个服务器的运行。该服务器的网络接口用于与外部的服务器和终端通过网络连接通信。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。[0028]如图3所示,在一个实施例中,提出了一种保单续期收费难度预测方法,该方法既可应用于终端中,也可以应用于服务器中,包括:[0029]步骤302,获取预设时间段内的保单信息,保单信息包括保单续期缴费信息。[0030]在本实施例中,为了建立续期收费难度识别模型,需要获取过往一段时间段内的保单信息作为分析数据。进一步的,为了续期收费难度识别模型预测的准确性,一般是采用最近一段时间内的保单信息,比如提取上一个季度的保单信息。保单信息包括:投保客户的基本属性信息、客户接触信息、客户价值信息、签单业务员信息、保单基本信息、保单续期缴费信息等等。其中,投保客户的基本属性信息包括投保客户的年龄、性别、婚姻状态等;客户接触信息包括:最近一年内是否发生过理赔、最近一年是否发生过投诉等;客户的价值信息包括客户的年收入、已交保费、未交保费等;签单业务员信息包括签单业务员续签率、签单业务员司龄等;保单基本信息包括保单保费、保单类型等基本信息。保单续期缴费信息包括:保单是否在宽限期内缴费、以及缴费的时间等。[0031]步骤304,根据保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从保单信息中提取所有可能影响该目标变量的特征因素。[0032]在本实施例中,保单续期缴费信息中包括了保单在宽限期内是否续期缴费的记录,其中,宽限期是指首次缴付保险费以后,每次保险费到期日起六十天内为宽限期,此间缴付逾期保险费并不收利息,所以宽限期可以理解为续期缴费给予的最晚期限。以保单在宽限期内是否续期缴费作为目标变量,通过对保单信息中的众多因素进行分析,抽取出所有可能影响该目标变量的特征因素。[0033]步骤306,计算提取的每个特征因素对目标变量的影响度,根据影响度的大小筛选出影响目标变量的目标特征因素。[0034]在本实施例中,由于可能影响目标变量保单在宽限期内是否续期缴费)的特征因素往往有很多个,在进行建模的过程中不可能将所有的特征因素都放入模型进行拟合训练。因此,需要从提取的众多可能影响目标变量的特征因素中筛选出对目标变量影响较大的特征因素,将筛选出的特征因素称为目标特征因素。故,提取完所有可能影响该目标变量的特征因素后,还需要计算提取的每个特征因素对目标变量的影响度,根据影响度的大小筛选出影响目标变量的目标特征因素。具体的,首先,计算每个特征因素对目标变量的影响权重,其次,根据影响权重计算得到每个特征因素对应的影响度,最后,根据影响度的大小,将那些对目标变量影响较小的特征因素剔除掉,保留影响度较大的特征因素,筛选出的对目标变量影响较大的特征因素即为目标特征因素。[0035]步骤308,根据目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。[0036]在本实施例中,从保单信息中的众多特征因素中筛选出对保单在宽限期内是否续期缴费有影响的目标特征因素后,根据该目标特征因素建立续期收费难度预测模型。具体的,首先,建立预测模型,预测模型的类型有多种,常见的预测模型有线性回归模型、逻辑回归模型、马尔科夫链模型等。以预测模型为逻辑回归模型为例进行说明,逻辑回归模型如下:Inp1-p二说+灿邱也+…祁丄。其中,p代表某件事情发生的概率,Ι-p代表某件事情不发生的概率,Xi,X2,X3,……,Xn为入模变量,,仇,β2,…,βη分别是各个入模变量的系数参数)。在本实施例中,将筛选出的目标特征因素作为该逻辑回归模型中的入模变量,BPXi,X2,X3,……,Χη为筛选出的目标特征因素;其次,将已确定在宽限期内是否续期缴费的保单数据作为逻辑回归模型的训练学习数据,通过训练学习确定逻辑回归模型中各个入模变量前的参数,即确定···,的值,训练学习的过程就是确定各个参数的过程。当各个参数确定完之后得到的便是续期收费难度识别模型,然后根据该续期收费难度识别模型就可以得到目标保单的续收难度值,后续根据该续收难度值进行有针对性的干预,有利于提尚续收的达成率。[0037]在本实施例中,通过获取预设时间内的保单信息,根据保单信息中的保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从保单信息中提取所有可能影响该目标变量的特征因素,计算提取的每个特征因素对目标变量的影响度,根据影响度的大小筛选出影响目标变量的目标特征因素,根据目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。该方法根据已有保单的信息从中筛选出对保单续期缴费有影响的目标特征因素,根据该目标特征因素建立了续期收费难度识别模型,然后根据该续期收费难度识别模型预测目标保单的续收难度值,便于后续根据目标保单的续收难度值进行针对性的干预,实现人力的合理调配,节省人力物力,而且有利于提尚续期达成率。[0038]在一个实施例中,所述续期收费难度识别模型用于预测目标保单的续收难度值的步骤包括:[0039]获取待预测的目标保单数据,根据续期收费难度识别模型计算与目标保单对应的续收难度概率值。[0040]在本实施例中,建立续期收费难度识别模型后,获取待预测的目标保单数据,其中,目标保单数据中包括有与目标特征因素有关的信息。通过提取该目标保单数据中目标特征因素所对应的数据,根据提取的目标特征因素所对应的数据计算与该目标保单对应的续收难度概率值。也就是说,通过续期收费难度识别模型计算得到的是目标保单的续收难度概率值,取值范围为0-1。该续收难度概率值反映了目标保单的续收难度,即续收难度概率值越大,表示该目标保单的续收难度越大。[0041]根据计算得到的续收难度概率值确定与目标保单对应的续收难度值。[0042]在本实施例中,续收难度概率值只是定性的反映了目标保单的续收难度,为了便于后续根据保单续收的难易进行有针对性的干预,在确定了目标保单的续收难度概率值后,根据该续收难度概率值确定与目标保单的续收难度值,续收难度值是对目标保单的难度进行的定量划分。具体的,预先设置续收难度概率值与续收难度值之间的对应关系,根据该对应关系确定与目标保单对应的续收难度值。比如,可以将续收难度值的范围设置为1-10分。这样就可以根据续收难度值将续收难度分为10个等级,针对不同的难度等级可以有针对性的采用不同的续收策略,便于合理调配人力,从而提高续收的达成率。[0043]如图4所示,在一个实施例中,计算提取的每个特征因素对目标变量的影响度,根据影响度的大小筛选出影响目标变量的目标特征因素的步骤包括:[0044]步骤306A,计算每个特征因素对目标变量的影响权重。[0045]在本实施例中,提取到影响目标变量的众多特征因素后,为了从众多特征因素中筛选出对目标变量影响较大的目标特征因素,需要计算每个特征因素对目标变量的影响度,首先,需要计算每个特征因素对目标变量的影响权重。影响权重可以采用计算WOEWeightofEvidence证据权重来得到。具体的,WOE的计算公式如下:WOEi=Inpyiprn,其中,下标i表示当前的组号,Py1是指这个组中保单在宽限期内没有续期缴费占所有样本中保单在宽限期内没有续期缴费的比例,Pm是指这个组中保单在宽限期内有续期缴费占所有样本中保单在宽限期内有续期缴费的比例。举个例子,假设我们抽取了100000个保单信息作为样本,其中,收集到的这100000个保单中有10000个已确定为保单在宽限期内没有续期缴费,90000个已确定为保单在宽限期内有续期缴费。以保单保费这个特征因素为例,将保单保费分为四类,分别为保费小于1000元的,保费在1000-3000元的,保费在3000-5000元的,保费在5000元以上的。分类统计的结果如表1所示。[0046]表I[0047][0049]上述将保单保费分为了四组,第一组为保费小于1000元,第二组为保费在1000-3000元的,第三组为保费在3000-5000元的,第四次为保费在5000元以上的(包括5000元)。根据上述WOE的计算公式可以得到第一组的WOE1=-O.74721,同样的,可以得到第二组的WOE2=O,第三组的WOE3=O.81093,第四组的W0E4=1.349927;其中,WOE的正负表示影响的方向,若WOE为正,说明变量当前取值对判断保单在宽限期内是否会缴费起到正向影响,当WOE为负时,说明起到了负的影响,而WOE绝对值的大小则是表示的影响权重的大小。[0050]步骤306B,根据影响权重计算得到每个特征因素对应的影响度。[0051]在本实施例中,当计算得到了每个特征因素对目标变量的影响权重后,还需要根据影响权重计算每个特征因素的影响度。具体的,影响度的大小可以采用IV的值来表示的。IVInformationValue,信息量)的计算公式如下:IVi=pyi-pru*TOEi,其中,下标i表示当前的组号。那么,根据该公式就可以计算得到第一组的影响度IV1=O.20765,第二组的影响度IV2=O,第三组的影响度IV3=O.135155,第四组的影响度IV4=O.14992。计算了各分组的影响度IV1,那么保单保费这个因素对应的影响度为各分组之和,S卩,那么计算得到保单保费的影响度IV=O.492706。[0052]步骤306C,根据影响度的大小筛选出对目标变量有影响的目标特征因素。[0053]在本实施例中,当确定了各个特征因素的影响度后,根据影响度的大小筛选出对目标变量保单在宽限期内是否续期缴费影响度比较大的因素,筛选出的因素称为目标特征因素。后续可以依据目标特征因素建立续期收费难度识别模型进行难度的预测。[0054]如图5所示,在一个实施例中,根据目标特征因素建立续期收费难度识别模型的步骤包括:[0055]步骤308A,将目标特征因素作为入模变量建立逻辑回归模型。[0056]在本实施例中,采用逻辑回归模型进行建模,将筛选出的目标特征因素作为入模变量。具体的,假设在入模变量用Xi,χ2,χ3,……,Χη表示,那么逻辑回归模型如下:111?1-ρ=β〇+βΐΧΐ+β2Χ2+···+βηΧη。其中,Xl,X2,X3,……,Xn为筛选出的目标特征因素,P代表某件事情发生的概率,I-P代表某件事情不发生的概率,,βΐ,β2,…,βη分别是各个入模变量的系数参数)。在训练学习前,各个入模变量前的参数是未知的,所以为了建立续期收费难度识别模型需要通过机器学习得到各个入模变量前的参数值,即说及,,…,βη的值。[0057]步骤308B,将获取的预设时间段内的保单信息作为逻辑回归模型的训练数据,通过训练学习得到续期收费难度识别模型。[0058]在本实施例中,建立逻辑回归模型后,将之前获取的预设时间段内的保单信息作为逻辑回归模型的训练数据,即将之前已确定保单在宽限期内是否续期缴费的保单信息作为逻辑回归模型的训练数据,通过训练学习得到续期收费难度识别模型。具体的,将之前已确定保单在宽限期内是否有续期缴费的保单信息作为逻辑回归模型的训练数据,将获取的上述保单信息数据按照预设比例随机分为三部分,分别为训练集、验证集和测试集。比如,将获取的保单数据按照40:30:30的比例进行分配。在训练集上通过机器学习不断调整逻辑回归算法参数,初步确定该模型中各个入模变量的参数。然后通过验证集进行进一步训练学习优化各个入模变量的参数(即AJ2,…,βη的值得到优化后的模型;测试集则是用来对已经训练好的模型进行测试,判断其预测的准确率,得到最优预测模型,当其预测的精准度、AUC指标、KS指标符合模型标准后确定该模型,其中,AUC指标、KS指标都是度量模型好坏的标准。最后确定的预测模型就是投入使用的续期收费难度识别模型。[0059]如图6所示,在一个实施例中,在根据目标特征因素建立续期收费难度识别模型的步骤之前还包括:[0060]步骤307,采用逐步回归的方法从目标特征因素中查找出引起多重共线性的因素,将查找到的引起多重共线性的因素从目标特征因素中删除。[0061]在本实施例中,在数据建模过程中,如果入模变量(目标特征因素之间的相关性比较高时,变量之间会表现出很强的共线性,容易造成模型失真。所以在根据影响度的大小筛选出影响目标变量的目标特征因素之后,需要查找容易引起多重共线性的因素,然后将查找到的引起多重共线性的因素从目标特征因素中剔除。具体的,采用逐步回归的方法从目标特征因素中查找出引起多重共线性的因素,然后将查找到的引起多重共线性的因素从目标特征因素中删除。举个例子,若查找到目标特征因素A和B之间的相关性比较高,说明两者对目标变量的影响效果可以等同,为了避免引起共线性,将目标特征因素A或B删除,也就是说,目标特征因素A和B的作用基本等同,只需要保留一个即可。[0062]在一个实施例中,根据计算得到的续收难度概率值确定与目标保单对应的续收难度值的步骤包括:获取预设的续收难度概率值与续收难度值的对应关系,根据对应关系确定与所述目标保单对应的续收难度值。[0063]在本实施例中,为了定量的对保单续期收费难度进行划分,同时也便于后续根据难度值有针对性的采取不同的措施进行干预,在根据续收难度识别模型计算得到目标保单的续收难度概率值后,还需要根据该续收难度概率值转换为直观的续收难度值。具体的,预先设置续收难度概率值与续收难度值的对应关系,根据该对应关系确定与目标保单对应的续收难度值。比如,将续收难度值的范围设置为1-10分。这样就可以根据续收难度值将续收难度分为10个等级,针对不同的难度等级可以有针对性的采用不同的续收策略。此外,为了有利于业务员进行催收,不仅需要了解保单的续收难度值,还需要了解影响续期收费的主要因素,因为即使保单的续收难度值相同,但是影响其续收难度的因素却各种各样,所以为了提高续收达成率,还需要展示影响保单续收难度值的主要影响因素,便于业务人员根据主要影响因素采用不同的策略进行催收。[0064]如图7所示,在一个实施例中,提出了一种保单续期收费难度预测装置,该装置包括:[0065]获取模块702,用于获取预设时间段内的保单信息,保单信息包括保单续期缴费信息。[0066]提取模块704,用于根据保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从保单信息中提取所有可能影响该目标变量的特征因素。[0067]筛选模块706,用于计算提取的每个特征因素对目标变量的影响度,根据影响度的大小筛选出影响目标变量的目标特征因素。[0068]建立模块708,用于根据目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。[0069]在一个实施例中,上述保单续期收费难度预测装置还包括:计算模块,用于获取待预测的目标保单数据,根据续期收费难度识别模型计算与目标保单对应的续收难度概率值。[0070]确定模块,用于根据计算得到的续收难度概率值确定与目标保单对应的续收难度值。[0071]如图8所不,在一个实施例中,筛选模块706包括:[0072]权重计算模块706A,用于计算每个特征因素对目标变量的影响权重。[0073]影响度计算模块706B,用于根据影响权重计算得到每个特征因素对应的影响度。[0074]因素筛选模块706C,用于根据影响度的大小筛选出对目标变量有影响的目标特征因素。[0075]如图9所示,在一个实施例中,建立模块708包括:[0076]模型建立模块708A,用于将目标特征因素作为入模变量建立逻辑回归模型。[0077]训练学习模块708B,用于将已确定保单在宽限期内是否续期缴费的保单信息作为逻辑回归模型的训练数据,通过训练学习得到保单续期收费难度识别模型。[0078]如图10所示,在一个实施例中,提出了一种保单续期收费难度预测装置1000,该装置除了包括模块702-708,还包括:[0079]查找模块710,用于采用逐步回归的方法从目标特征因素中查找出引起多重共线性的因素。[0080]删除模块712,用于将查找到的引起多重共线性的因素从目标特征因素中删除。[0081]在一个实施例中,确定模块还用于获取预设的续收难度概率值与续收难度值的对应关系,根据对应关系确定与目标保单对应的续收难度值。[0082]本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体Read-OnlyMemory,ROM等非易失性存储介质,或随机存储记忆体(RandomAccessMemory,RAM等。[0083]以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。[0084]以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

权利要求:1.一种保单续期收费难度预测方法,所述方法包括:获取预设时间段内的保单信息,所述保单信息包括保单续期缴费信息;根据所述保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从所述保单信息中提取所有可能影响该目标变量的特征因素;计算提取的每个特征因素对所述目标变量的影响度,根据所述影响度的大小筛选出影响所述目标变量的目标特征因素;根据所述目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。2.根据权利要求1所述的方法,其特征在于,所述续期收费难度识别模型用于预测目标保单的续收难度值的步骤包括:获取待预测的目标保单数据,根据所述续期收费难度识别模型计算与目标保单对应的续收难度概率值;根据计算得到的所述续收难度概率值确定与所述目标保单对应的续收难度值。3.根据权利要求1所述的方法,其特征在于,所述计算提取的每个特征因素对所述目标变量的影响度,根据所述影响度的大小筛选出影响所述目标变量的目标特征因素的步骤包括:计算每个特征因素对所述目标变量的影响权重;根据所述影响权重计算得到每个特征因素对应的影响度;根据所述影响度的大小筛选出对所述目标变量有影响的目标特征因素。4.根据权利要求1所述的方法,其特征在于,所述根据所述目标特征因素建立保单续期收费难度识别模型的步骤包括:将所述目标特征因素作为入模变量建立逻辑回归模型;将获取的所述预设时间段内的保单信息作为所述逻辑回归模型的训练数据,通过训练学习得到保单续期收费难度识别模型。5.根据权利要求1-4任一所述的方法,其特征在于,在所述根据所述目标特征因素建立续期收费难度识别模型的步骤之前还包括:采用逐步回归的方法从所述目标特征因素中查找出引起多重共线性的因素;将查找到的引起多重共线性的因素从所述目标特征因素中删除。6.—种保单续期收费难度预测装置,其特征在于,所述装置包括:获取模块,用于获取预设时间段内的保单信息,所述保单信息包括保单续期缴费信息;提取模块,用于根据所述保单续期缴费信息将保单在宽限期内是否续期缴费作为目标变量,从所述保单信息中提取所有可能影响该目标变量的特征因素;筛选模块,用于计算提取的每个特征因素对所述目标变量的影响度,根据所述影响度的大小筛选出影响所述目标变量的目标特征因素;建立模块,用于根据所述目标特征因素建立续期收费难度识别模型,所述续期收费难度识别模型用于预测目标保单的续收难度值。7.根据权利要求6所述的装置,其特征在于,所述装置还包括:计算模块,用于获取待预测的目标保单数据,根据所述续期收费难度识别模型计算与目标保单对应的续收难度概率值;确定模块,用于根据计算得到的所述续收难度概率值确定与所述目标保单对应的续收难度值。8.根据权利要求6所述的装置,其特征在于,所述筛选模块包括:权重计算模块,用于计算每个特征因素对所述目标变量的影响权重;影响度计算模块,用于根据所述影响权重计算得到每个特征因素对应的影响度;因素筛选模块,用于根据所述影响度的大小筛选出对所述目标变量有影响的目标特征因素。9.根据权利要求6所述的装置,其特征在于,所述建立模块包括:模型建立模块,用于将所述目标特征因素作为入模变量建立逻辑回归模型;训练学习模块,用于将获取的所述预设时间段内的保单信息作为所述逻辑回归模型的训练数据,通过训练学习得到保单续期收费难度识别模型。10.根据权利要求6-9任一所述的装置,其特征在于,所述装置还包括:查找模块,用于采用逐步回归的方法从所述目标特征因素中查找出引起多重共线性的因素;删除模块,用于将查找到的引起多重共线性的因素从所述目标特征因素中删除。

百度查询: 平安科技(深圳)有限公司 保单续期收费难度预测方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。