首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于数据增强和语义感知的Bash代码注释自动生成方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南通大学

摘要:本发明提供了一种基于数据增强和语义感知的Bash代码注释自动生成方法,属于计算机领域。解决了Bash注释生成任务中低资源和不能有效利用BERT模型输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在模型嵌入层使用NP‑GD,生成多组对抗例子;S2:利用原训练集和生成的对抗例子微调CodeBERT;S3:使用LSTM+Attention聚合步骤S2输出的多层表征信息;S4:使用Transformer解码器解码步骤S3输出的融合向量并输出Bash注释。本发明的有益效果为:该方法可以捕获更多的表征信息,提高Bash注释生成的质量。

主权项:1.一种基于数据增强和语义感知的Bash代码注释自动生成方法,其特征在于,包括以下步骤:S1、将NL2Bash研究和NLC2CMD竞赛共享的语料库合并去重,最终构建了一个包含10,592个样本的高质量语料库,设定语料库的格式为Bash代码段,英文描述;S2、对构建的语料库随机划分成训练集、验证集和测试集;S3、构建预训练模型CodeBERT和NP-GD对抗训练方法;S4、使用CodeBERT生成词嵌入E1,并沿着损失函数上升的方向在Embedding层使用NP-GD对抗方法添加扰动,生成一系列对抗例子E2;S5、使用所述步骤S3得到的词嵌入E1和对抗例子E2对预训练模型CodeBERT继续微调,输出12层表征信息CLSi;S6、使用LSTM+Attention构建语义感知层,输出融合向量h;S7、使用Transformer解码器解码所述步骤S6得到的融合向量h,输出相应Bash代码注释。

全文数据:

权利要求:

百度查询: 南通大学 一种基于数据增强和语义感知的Bash代码注释自动生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。