首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于LDA主题建模的软件可理解性确定方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京航空航天大学

摘要:本发明涉及一种基于LDA主题建模的软件可理解性确定方法及系统,所述方法包括:获取待测软件的源代码;对所述源代码进行静态扫描,分析软件中类以及类中的各函数和变量;获取类所包含的函数和变量,并将所述函数和所述变量一一对应;对所述类以及所述类所属的函数和变量进行数据清洗,得到映射好的词袋;基于所述映射好的词袋进行主题建模,得到每个类对应的主题词;衡量主题词与类的相似程度;基于所述主题词与类的相似程度确定每个类文件的可理解性;基于所述每个类文件的可理解性确定整个软件的可理解性。本发明中的上述方法弥补了现有技术的空白。

主权项:1.一种基于LDA主题建模的软件可理解性确定方法,其特征在于,所述方法包括:获取待测软件的源代码;对所述源代码进行静态扫描,分析软件中类以及类中的各函数和变量;获取类所包含的函数和变量,并将所述函数和所述变量一一对应;对所述类以及所述类所属的函数和变量进行数据清洗,得到映射好的词袋,具体包括:对所述类以及所述类所属的函数和变量进行分词处理;对分词处理后的类以及所述类所属的函数和变量进行停用词处理;对停用词处理后的类以及所述类所属的函数和变量进行词性还原和词干提取;将词性还原和词干提取后的类以及所述类所属的函数和变量,根据类和它的内部元素的从属关系,一一对应地将每个类映射为一个个词袋;基于所述映射好的词袋进行主题建模,得到每个类对应的主题词,具体是采用LDA算法进行主题建模;衡量主题词与类的相似程度;基于所述主题词与类的相似程度确定每个类文件的可理解性;基于所述每个类文件的可理解性确定整个软件的可理解性;所述衡量主题词与类的相似程度具体包括:遍历类名称列表中的单词,记为ClassWord;遍历主题词列表中的词,记为TopicWord;采用WordNet相似度计算方法计算所述ClassWord和所述TopicWord的相似度;遍历主题词列表中的下一个词,重复前一步骤,直到主题词列表中的词遍历完毕;选取与ClassWord相似度最高的TopicWord作为最终匹配词;遍历类名称列表中的下一个单词,重复上述步骤,直到类名称列表中的所有单词遍历完毕;所述基于所述每个类文件的可理解性确定整个软件的可理解性具体包括:对每个类文件的可理解性采用K-means算法进行聚类划分,得到整个软件的可理解性。

全文数据:

权利要求:

百度查询: 北京航空航天大学 一种基于LDA主题建模的软件可理解性确定方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。