首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于弱监督持续学习的边缘设备加密流量分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京大学

摘要:本发明公开一种基于弱监督持续学习的边缘设备加密流量分类方法,首先获取已有的真实加密流量数据,包括少量的有标记数据和大量的无标记数据;随机初始化一个加密流量分类模型,然后利用当前加密流量数据训练模型并存储少量的核心有标记数据;当出现一批新类别的加密流量时,在旧模型基础上动态地分配计算资源分别用于使用新类流量的少量标注的有标记数据训练模型,充足的无标记数据训练模型以及所存储的其他旧类流量的核心有标记加密流量数据训练模型,并保存少量的核心有标记数据。本发明缓解标记数据的需求压力并解决新旧类别加密流量无法同时获得的难点,并且在实施过程中对资源要求较低且能充分利用有限的资源配额,易于在边缘设备进行部署。

主权项:1.一种基于弱监督持续学习的边缘设备加密流量分类方法,其特征在于:首先收集流经边缘设备的新旧类别加密流量数据并对少量数据进行标注,然后使用弱监督范式完成模型持续学习;具体流程包括数据采集、弱监督持续学习和加密流量分类器预测;数据采集的步骤为:步骤100,收集流经边缘设备的加密流量数据;步骤101,对少部分加密流量数据进行标注并进行数据预处理,得到有标记数据集合S0和无标记数据集合U0;步骤102,收集流经边缘设备的新类别的加密流量数据;步骤103,对少部分的新类别加密流量数据进行标注并进行数据预处理,得到有标记数据集合S1和无标记数据集合U1;弱监督持续学习的步骤为:步骤200,随机初始化训练模型M,该模型M以预处理后的加密流量数据为输入,可输出一个加密流量的特征向量,并据此特征向量得到加密流量类别的分类结果或重建的加密流量数据;步骤201,基于当前计算资源配额,优先分配资源给有标记数据集合S0直至资源达到阈值T0,将剩余不超过某一阈值T1的资源分配给无标记数据集合U0;步骤202,基于交叉熵损失和重建损失,使用当前批次的有标记数据和无标记数据更新模型M,并统计损失函数的平均值,重复若干次步骤201及本步骤后,损失函数均值基本不下降则进入步骤203;步骤203,保存模型M,并使用模型M在S1上计算得到各类别加密流量特征空间中的类中心;步骤204,计算有标记数据集合S1中各加密流量数据与其对应类中心的余弦相似度,选取余弦相似度大小位于中间位置的T2个数据保存到缓冲区集合D;步骤205,扩展模型M的分类器;步骤206,基于当前计算资源配额,优先分配资源给有标记数据集合S1和缓冲区集合D直至S1和D所占用的资源同步达到阈值T0,将剩余不超过阈值T1的资源分配给无标记数据集合U1;步骤207,基于交叉熵损失和重建损失,使用当前批次的新类有标记数据、旧类有标记数据和新类无标记数据更新模型M,并统计损失函数的平均值,重复若干次步骤206及本步骤后,损失函数均值基本不下降则进入步骤208;步骤208,输出训练好的模型M;加密流量分类器预测的步骤为:步骤300,收集流经边缘设备包含新、旧类别的加密流量测试数据并进行预处理;步骤301,利用训练好的模型M进行预测,可对流经边缘设备的新、旧类别加密流量数据进行分类。

全文数据:

权利要求:

百度查询: 南京大学 一种基于弱监督持续学习的边缘设备加密流量分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。