首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多峰特征对齐的跨项目软件缺陷预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州市凯泽利科技有限公司

摘要:本发明公开了一种基于多峰特征对齐的跨项目软件缺陷预测方法,主要利用多重线性调节得到特征和分类器预测之间的互协方差,以捕获特征的多峰分布;在捕获出的多峰分布基础上,需要进一步知道项目间分布差异的多少,并以此减小差异;通过最大密度散度MDD来度量不同项目间的多峰分布差异;同时,在计算MDD时,需要使用伪标签,通过最小化主分类器和辅助分类器之间的预测偏差获得更加准确的伪标签;训练中不断地把没有对齐的峰不断迭代MDD损失来对齐分布,解决项目特征的多峰分布难以对齐的问题,从而提高了跨项目预测的精度。

主权项:1.一种基于多峰特征对齐的跨项目软件缺陷预测方法,其特征在于,包括以下步骤:S1生成相应抽象语法树:使用开源编译工具Javalang来解析Java源文件并生成相应抽象语法树;选择了四种节点:分别是方法调用类别节点、声明类别节点、控制流类别节点和必要的其他类别节点;从而保留小部分与代码的缺陷高度相关的节点;S2标记序列:将筛选节点之后的抽象语法树通过深度优先遍历得到标记序列;S3构建了节点和正整数之间一一对应的映射规则:每个节点都随机分配一个唯一的整数标识符,其数值范围从1到节点类型的总数;通过这种方式,相同的节点保持为相同的整数标识符,而不同的节点仍然保持不同;S4通过所述映射规则,节点标记序列被转换为对应的整型向量,从而可以作为深度神经网络的输入;S5使用神经网络作为特征生成器从映射后的整型向量中提取软件项目的语义特征;S6根据不同的维度的特征设计出与软件缺陷预测相关的手工特征,将手工特征和语义特征进行拼接,形成联合特征;S7通过充分利用未标记的目标领域数据来学习目标领域的特定领域知识,即训练一个主分类器F1和辅助分类器F2,保证其能够正确地对源项目样本进行分类,然后利用主分类器F1给目标项目贴上伪标签;S8对于所述联合特征,利用多重线性调节得到特征和主分类器预测两者的互协方差,以捕获项目特征的多峰分布;S9采用最大密度散度MaximumDensityDivergence,MDD来度量多峰分布差异;度量两个不同多峰分布之间的分布差异,使域间分歧减小且域内密度增大,对齐源域和目标域的多峰分布,使两个域本身更加紧凑;S10最终训练好的模型被应用于目标项目,取F1和F2两者输出的算术平均值,如果该算术平均值大于0.5则判断为存在可能的项目缺陷,否则判断为不存在。

全文数据:

权利要求:

百度查询: 广州市凯泽利科技有限公司 一种基于多峰特征对齐的跨项目软件缺陷预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。