恭喜第四范式(北京)技术有限公司王海获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜第四范式(北京)技术有限公司申请的专利处理数据表及自动训练机器学习模型的方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114443639B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011205070.2,技术领域涉及:G06F16/22;该发明授权处理数据表及自动训练机器学习模型的方法和系统是由王海;焦英翔;李文昊;涂威威设计研发完成,并于2020-11-02向国家知识产权局提交的专利申请。
本处理数据表及自动训练机器学习模型的方法和系统在说明书摘要公布了:提供了一种处理数据表及自动训练机器学习模型的方法和系统。所述处理数据表的方法包括:获取关于多个数据表的表关系配置信息,其中,所述表关系配置信息包括:两两数据表之间的关联关系;基于所述表关系配置信息,将所述多个数据表拼接成一个基础样本表;基于所述基础样本表中的字段生成关于所述字段的衍生特征,并将生成的衍生特征并入所述基础样本表形成包括多条机器学习样本的样本表。
本发明授权处理数据表及自动训练机器学习模型的方法和系统在权利要求书中公布了:1.一种处理数据表的方法,包括:获取关于多个数据表的表关系配置信息,其中,所述表关系配置信息包括:两两数据表之间的关联关系;基于所述表关系配置信息,将所述多个数据表拼接成一个基础样本表;基于所述基础样本表中的字段生成关于所述字段的衍生特征,并将生成的衍生特征并入所述基础样本表形成包括多条机器学习样本的样本表;其中,基于所述基础样本表中的字段生成关于所述字段的衍生特征并将生成的衍生特征并入所述基础样本表的步骤包括:(a)对当前的特征搜索空间中的特征进行第i轮衍生,并从第i轮生成的衍生特征中筛选出特征重要性较高的衍生特征,其中,i的初始值为1,特征搜索空间的初始值为基础样本表中的特征重要性最高的第一预定数量的字段;(b)当i小于预设阈值时,将特征搜索空间更新为基础样本表中除已被作为特征搜索空间之外的特征重要性最高的第一预定数量的字段,令i=i+1,并返回执行步骤(a);(c)当i大于或等于预设阈值时,将前i轮筛选出的衍生特征并入所述基础样本表;其中,从第i轮生成的衍生特征中筛选出特征重要性较高的衍生特征的步骤包括:针对第i轮生成的衍生特征中的每个衍生特征,基于当前的特征搜索空间中的特征和该衍生特征训练对应的机器学习模型;从第i轮生成的衍生特征中筛选出:对应的机器学习模型的效果满足预设条件的衍生特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人第四范式(北京)技术有限公司,其通讯地址为:100085 北京市海淀区清河中街66号院1号楼九层LO901-1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。