买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳前海微众银行股份有限公司
摘要:本发明公开了一种基于列存储的决策树构造方法、装置、设备及存储介质,涉及机器学习技术领域,该方法包括:根据当前层中各个节点的第一拆分特征读取对应的列数据,并根据所述列数据将各个样本划分至所述当前层中的各个节点;获取所述各个节点中的分组样本,并统计所述分组样本中各个特征的特征分布情况;根据所述特征分布情况,生成下一层节点,对所述下一层节点进行分裂,直至收敛,获得决策树。由此,基于列存储构造决策树,缩减了数据读取的时间,提升了工作效率。
主权项:1.一种基于列存储的决策树构造方法,其特征在于,该方法包括:根据当前层中各个节点的第一拆分特征读取对应的列数据,并根据所述列数据将各个样本划分至所述当前层中的各个节点;获取所述各个节点中的分组样本,并统计所述分组样本中各个特征的特征分布情况;其中,所述获取所述各个节点中的分组样本,并统计所述分组样本中各个特征的特征分布情况的步骤包括:将划分至同一个节点的所述样本记为所述分组样本,获取所述各个节点对应的分组样本;根据预设特征统计规则对所述分组样本进行统计,获得各个特征的特征分布情况,其中,所述预设特征统计规则包括将各个特征用正态分布进行统计,或通过平均值、最大值、最小值和中位值的方式进行统计;将所述特征分布情况发送至一个或多个执行机,由所述一个或多个执行机进行并行求解获得最优值;将所述最优值作为第二拆分特征生成下一层节点;对所述下一层节点进行分裂,直至收敛,获得决策树。
全文数据:
权利要求:
百度查询: 深圳前海微众银行股份有限公司 基于列存储的决策树构造方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。