恭喜江苏电力信息技术有限公司刘小磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜江苏电力信息技术有限公司申请的专利一种基于弱监督学习的互联网流量分类识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119109714B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411579562.6,技术领域涉及:H04L9/40;该发明授权一种基于弱监督学习的互联网流量分类识别方法是由刘小磊;吴小虎;张明远;张小坚;静柯设计研发完成,并于2024-11-07向国家知识产权局提交的专利申请。
本一种基于弱监督学习的互联网流量分类识别方法在说明书摘要公布了:本发明公开了一种基于弱监督学习的互联网流量分类识别方法,该方法通过构造包含多种协议应用载荷特征的确定性有限状态机,然后将所述确定性有限状态机与互联网流量进行匹配,将与所述确定性有限状态机匹配成功的互联网流量作为已知流量并增加相应的应用类型标签,同时将未能与所述确定性有限状态机匹配成功的互联网流量作为未知流量,由此进行基于应用载荷匹配的互联网流量自动标记方法,通过本发明方法可以在未知流量众多的互联网环境中,通过构建高效的弱监督流量分类模型,来快速实现对互联网流量类型的识别和分类。
本发明授权一种基于弱监督学习的互联网流量分类识别方法在权利要求书中公布了:1.一种基于弱监督学习的互联网流量分类识别方法,其特征在于,包括:步骤1)构造包含多种协议应用载荷特征的确定性有限状态机,然后将所述确定性有限状态机与互联网流量进行匹配,将与所述确定性有限状态机匹配成功的互联网流量作为已知流量并增加相应的应用类型标签,同时将未能与所述确定性有限状态机匹配成功的互联网流量作为未知流量;步骤2)抽取已知流量和未知流量中的典型特征,然后基于所抽取的典型特征,计算未知流量与已知流量之间的余弦相似度值,基于未知流量对应的最大余弦相似度值,获取未知流量对应的应用类型标签,再将所述未知流量对应的最大余弦相似度值与相似度阈值进行比较,若最大余弦相似度值超过相似度阈值,则对未知流量增加强标签;否则,增加弱标签;步骤2)的具体方法包括:步骤2-1)抽取出有标签的数据集和无标签数据集中各条流的特征构建特征向量,从而形成有标签的特征向量集合和无标签的特征向量集合;式中,为特征数量,分别表示有标签数据集中第i条已知流所对应的各项特征值,分别表示无标签数据集中第j条未分类流所对应的各项特征值;和分别为有标签数据集以及无标签数据集的数据量;步骤2-2)从无标签的特征向量集合中逐条读取未分类流,并计算其与有标签的特征向量集合中各条已知流之间的余弦相似度值,计算公式如下所示: ;式中,表示未分类流与已知流之间的余弦相似度,其最大值为1,最小值为0;步骤2-3)设置相似度阈值,如果余弦相似度值超过相似度阈值,则将未分类流增加强标签,否则,增加弱标签,同时形成强标签数据集和弱标签数据集,式中,和分别为强标签数据集以及弱标签数据集的数据量;为强标签数据集中的第i条数据流;为对应的应用类型标签;为弱标签数据集中的第i条数据流;为对应的应用类型标签;步骤3)将强标签与弱标签的权重代入到残差神经网络模型中,利用分类好的历史样本流量进行分类并计算整体损失,并利用softmax函数对整体损失进行标准化处理,从而得到强标签与弱标签的最优权重;步骤3)的具体方法包括:步骤3-1)利用分布对齐方法,对弱标签数据集进行指数移动平均计算,从而将弱标签转换为对应的强标签,经过上述转换后,部分弱标签数据集中的元素会出现相似度值超过的情况,从而转移到强标签数据集中;所述指数移动平均计算的计算公式如下: ;式中,为根据预测概率值的最大值生成强标签的函数;步骤3-2)将强标签与弱标签的权重分别设置为和,利用残差神经网络模型,对流量样本进行分类并计算整体损失,具体计算公式如下: ;式中,和分别表示强标签和弱标签数据集中模型分类的结果,表示标准交叉熵损失;步骤3-3)利用softmax函数对整体损失进行标准化处理,从而得到强标签与弱标签的最优权重;步骤4)将强标签与弱标签的最优权重代入残差神经网络模型中,利用残差神经网络模型实现对互联网流量的分类识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏电力信息技术有限公司,其通讯地址为:210024 江苏省南京市鼓楼区北京西路20号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。