首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于机器学习的代码审核和优化系统及其使用方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海灵曼信息科技有限公司

摘要:本发明公开了基于机器学习的代码审核和优化系统及其使用方法,涉及代码审核技术领域,包括源代码分解单元、代码审核模块、病毒代码检测单元和代码优化单元,本发明通过对获取的源代码进行查重,计算代码的相似度,剔除库中已存在的相似度高的代码,获取有效的源代码,将源代码分割为若干个代码段,卷积神经网络进行卷积运算,对代码审核结果进行预测,提高了审核预测的准确性,通过LBP特征、GLCM特征和n‑gram特征进行融合,使用随机森林判别代码是否为病毒代码,防止病毒代码漏检造成代码库的安全受到影响,引入临时变量数组,建立替换规则,获得优化后的代码,可以提高代码优化缩减率,减少代码的运行时间。

主权项:1.基于机器学习的代码审核和优化系统,其特征在于:包括源代码分解单元1、代码审核模块2、病毒代码检测单元3和代码优化单元4;所述源代码分解单元1用于查重获取有效的源代码,使用优化的抽象语法树构建源代码的抽象语法结构,提取源代码中的语义特征信息,同时提取源代码中的图像特征信息;所述源代码分解单元1包括代码查重模块11、抽象语法树优化模块12、语义特征提取模块13和图像特征提取模块14;所述代码查重模块11用于对源代码进行查重,剔除与库中代码重复性高的源代码;所述代码查重模块11包括特征增强模块111和相似度比较模块112;所述特征增强模块111用于使用图卷积神经网络提取特征,使用图注意力机制进行特征增强;所述相似度比较模块112用于获得不同代码之间的相似度向量,计算代码之间的相似度,剔除相似度高的源代码;所述抽象语法树优化模块12用于对抽象语法树的节点信息特点进行筛选,去除冗余的节点信息,获得优化的抽象语法树;所述语义特征提取模块13用于使用优化的抽象语法树提取语义特征;所述图像特征提取模块14用于提取数据中的LBP特征、GLCM特征和n-gram特征;所述代码审核模块2用于获取源代码的语义特征矩阵,使用卷积神经网络对代码审核结果进行预测;所述代码审核模块2包括源代码分割模块21、注释信息获取模块22和审核结果预测模块23;所述源代码分割模块21用于将整段源代码分割成若干个代码段,获取每个代码段的语义特征向量,构建语义特征矩阵;所述注释信息获取模块22用于获取包含修改前后的代码和开发人员提交代码的注释信息在内的数据,为代码预测提供更多的信息支撑;所述审核结果预测模块23用于对审核结果进行预测,获取合格的代码;所述病毒代码检测单元3用于提取病毒代码特征,判别代码中的病毒代码;所述病毒代码检测单元3包括特征融合模块31、代码训练模块32和安全判别模块33;所述特征融合模块31用于获取多个特征进行融合;所述代码训练模块32用于对数据集进行标准化处理,使用随机森林对代码进行判别;所述安全判别模块33用于对病毒代码进行风险等级判定;所述代码优化单元4用于对能够匹配规则的特定指令动作,使用建立的映射公式,对中间代码进行优化;所述代码优化单元4包括映射构建模块41、替换规则建立模块42和优化结果测试模块43;所述映射构建模块41用于引入临时变量数组,将内存虚拟操作映射到本地操作上;所述替换规则建立模块42用于建立替换规则,将原有的内存虚拟操作替换为本地操作;所述优化结果测试模块43用于执行替换后的代码,测试其优化效果。

全文数据:

权利要求:

百度查询: 上海灵曼信息科技有限公司 基于机器学习的代码审核和优化系统及其使用方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。