首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于纵向联邦学习的航班延误预测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国民航大学

摘要:本发明公开了一种基于纵向联邦学习的航班延误预测方法及系统,属于航空信息处理技术领域,包括:联邦数据预处理,在联邦学习应用场景下,使用统一的数据预处理标准,各机场按照所述数据预处理标准对数据进行清洗;加密实体对齐阶段,使用一种基于非对称加密RSA算法和哈希函数,在此过程由航空公司方产生公钥发送给机场方,去除第三方来求双方共有的数据交集航班号ID;加密模型训练,确定共有的实体ID后,机场和航空公司利用这些共有的实体数据协同训练一个机器学习模型;选择纵向联邦学习框架融合逻辑回归算法来进行航班延误预测;输出,采用部分指标作为航班延误预测模型性能的评估。解决纵向联邦学习中参与方之间通信不安全的问题。

主权项:1.一种基于纵向联邦学习的航班延误预测方法,其特征在于,包括:联邦数据预处理,在联邦学习应用场景下,使用统一的数据预处理标准,各机场按照所述数据预处理标准对数据进行清洗;加密实体对齐阶段,使用一种基于非对称加密RSA算法和哈希函数,在此过程由航空公司方产生公钥发送给机场方,去除第三方来求双方共有的数据交集航班号ID;加密模型训练,确定共有的实体ID后,机场和航空公司利用这些共有的实体数据协同训练一个机器学习模型;选择纵向联邦学习框架融合逻辑回归算法来进行航班延误预测;其中:模型的加密训练方法包括:步骤1,协调者生成密钥对,并将公钥分别发送给机场和航空公司;步骤2,机场和航空公司以加密的方式交换中间参数,中间参数用于计算梯度和损失函数值;步骤3,机场和航空公司计算梯度值并加密,机场方作为主动方计算加密损失函数值,双方将加密结果分别发送给协调者;步骤4,协调者利用私钥对双方传来的加密数据解密,并将结果返回给机场和航空公司;双方根据返回的梯度信息来更新模型参数;对本地的数据进行更新和分类,为航班延误预测做出依据;结合航班延误层次架构模型,算法的设计是隐私保护的逻辑回归算法,包括采用Paillier同态加密算法及其对梯度进行加密计算和隐私保护的训练过程;在纵向联邦学习框架中,两个参与方分别是机场和航空公司,设机场的训练数据集{XAPi,y}={XAP1,XAP2,XAP3,…,XAPn,y},航空公司数据集{XDLi}={XDL1,XDL2,XDL3,...,XDLn},其中,n表示双方包含的特征个数,机场数据{XAPi,y}包括延误与否作为y标签,y∈0,1,0代表没有延误,1代表发生延误;通过学习到的模型训练出一组参数,使得样本映射到0,1;定义主动方:数据的提供方,拥有训练特征和标签数据;定义被动方:数据的提供方,只提供训练特征,没有样本标签;定义协调方:在联邦学习参与方训练过程起辅助协调的作用,辅助多方完成联合建模,用来聚合梯度或者模型;将航班延误与否视为二分类问题,输出结果为两个值,并利用Logistic函数将产生的预测值映射到0~1之间;纵向联邦学习将不同参与方的特征加密聚合,由此推断基于纵向联邦学习框架的逻辑回归算法损失函数;输出,采用部分指标作为航班延误预测模型性能的评估;具体包括:选取准确率作为评估指标之一;所述准确率指的是所有预测结果为正确的占总的航班数的比例;引入召回率和F1-score;所述召回率代表对于发生延误航班情况的预测结果正确的航班数量占总延误航班数的百分比;F1-score是对召回率和准确率的调和平均数,F1-score越高,模型越好。

全文数据:

权利要求:

百度查询: 中国民航大学 一种基于纵向联邦学习的航班延误预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。