东北大学赵相国获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北大学申请的专利基于半监督学习的区块链异常交易检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116644283B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310605595.2,技术领域涉及:G06F18/15;该发明授权基于半监督学习的区块链异常交易检测方法是由赵相国;何睿;袁野;要鑫;毕鑫设计研发完成,并于2023-05-26向国家知识产权局提交的专利申请。
本基于半监督学习的区块链异常交易检测方法在说明书摘要公布了:本发明提供一种基于半监督学习的区块链异常交易检测方法,涉及区块链技术领域。针对区块链交易节点特征多样性的特点,提出了基于集成学习的特征选择方法;针对区块链交易中数据集不平衡的现象,提出基于一分类的数据预处理方法;针对传统Tri‑Training方法中预测偏差造成反向优化的问题,本发明提出Multi‑Training方法获取具有高置信度的伪标签数据用于区块链异常交易检测模型的训练。本发明充分利用有标签数据及无标签数据,增强检测的精度,减少冗余特征的干扰,有效解决数据不平衡导致负例样本欠拟合的问题,提升训练模型的泛化能力。
本发明授权基于半监督学习的区块链异常交易检测方法在权利要求书中公布了:1.一种基于半监督学习的区块链异常交易检测方法,其特征在于:包括如下步骤: 步骤1:特征工程与特征选择;获取区块链交易初始数据集,对数据集有效特征进行提取;结合过滤法ANOVA和包裹法RFECV,通过单变量自身情况和多变量之间的关系,提取有效检测区块链异常交易的特征;具体方法为: 对于初始特征集F={F1,F2,F3,...,FN-1,FN},采用过滤法ANOVA生成初筛特征集F’={F’1,F’2,F’3,...,F’m-1,F’m};然后使用包裹法RFECV最后选择平均分最高的特征子集; 所述采用过滤法ANOVA生成初筛特征集的具体方法为: 首先计算均值,第i个总体的样本均值和总均值,ni为第i个水平总体的样本观察值个数,然后计算误差平方和; 各组平均值与总平均值的误差平方和,反映了各水平总体的样本均值之间的差异程度,表示因素A的各个水平理论平均值的不同带来的影响,记为组间平方和SSA,SSA公式如下: 其中,k为控制变量的水平数;为每组样本的平均值;为总体样本的平均值; 各组的各样本数据与其组平均值误差的平方和,反映了每个样本各观察值的离散状况,表示随机误差的影响,记为组内平方和SSE,SSE公式如下: 其中,xij为控制变量第i个水平下的j个样本值; 全部观察值与总平均值的误差平方和,反映全部观察值的离散程度,记为总误差平方和SST,SST公式如下: 组间均方MSA和组内均方MSE分别由误差平方和除以各自的自由度dfA和dfE得到,MSAMSE比值构成F分布: 其中,n为样本数;F作为统计检验量,也是有对应概率分布的,即满足Fk-1,n-k的概率分布,F值越大则SSA相比SSE越大,也就是组间差异越大、不同组的数据更倾向于抽样自不同总体、零假设成立的可能性p值越低,反之则零假设成立的可能性就越高,由此选取F值大的初筛特征集F’={F’1,F’2,F’3,...,F’m-1,F’m}; 所述包裹法RFECV先使用递归特征消除法REF获取各个特征的ranking,然后再基于ranking,依次选择[min_features_to_select,lenfeature]个特征数量的特征子集进行模型训练和交叉验证,最后选择平均分最高的特征子集; 步骤2:数据预处理;对正负例数量不平衡的初始数据集进行预处理; 步骤3:模型训练;使用改进的Tri-Training方法对大量无标签数据进行分类,基于DBSCAN获得具有高置信度的伪标签数据,使用训练集数据和伪标签数据对基分类器进行迭代优化; 步骤4:将目标监测数据输入异常交易检测模型,得到检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路三号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。