首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种协同过滤并权衡数据信息的API推荐方法与装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京航空航天大学

摘要:本发明公开了一种协同过滤并权衡数据信息的API推荐方法与装置,方法包括:获取当前开发项目的所有调用关系信息,包括项目中已开发部分的声明和声明中调用的API接口;根据处理过后的调用关系,从代码数据库中先推荐出与当前开发项目相似的三个项目,再从三个相似项目中的所有声明中获取与当前在开发声明相似度超过阈值的声明,再由相似声明集合中的所有API接口作为候选列表;最后由这些声明中所含有的调用进行协同过滤评分,为用户推荐所需接口。本发明在进行代码推荐时考虑使用了代码之间的调用关系信息,引入的近邻因子根据相似声明与调用数量上的关系,协调了协调过滤推荐时声明与调用对最后评分结果的影响,能够获得更好的推荐效果。

主权项:1.一种协同过滤并权衡数据信息的API推荐方法,其特征在于,包括如下步骤:1获取当前开发项目的所有调用关系信息,包括项目中已开发部分的声明和声明中调用的API接口;2将代码数据库中已有的项目的所有API接口编号,计算代码数据库中已有的项目与当前开发项目的相似度,数据库中相似度前三的项目作为候选集,再获取相似项目中的所有声明,计算这些声明与当前开发的声明的相似度,进行重排序,最后获取相似度超过阈值μ的声明,再由相似声明集合中的所有API接口作为候选列表;3根据候选列表中的所有API接口,计算近邻因子权重和API推荐评分并进行排序,为用户推荐所需接口;所述方法根据如下公式计算项目间的相似度: 其中,p表示当前正在开发的项目,q表示计算与当前项目相似度的代码数据库中的项目,n表示代码数据库中所有API接口的种类数,其中表示编号为t的接口在当前项目p中的权重,ωt表示编号为t的接口在项目q中的权重;tf为当前项目调用编号为t的接口的次数,k、b为BM25中的给定参数,L为当前项目调用接口数量与平均项目调用接口数量的比值,为逆文本频度算法,at为数据库中调用过t接口的项目数,|P|为数据库中的项目总数;所述方法根据如下公式计算声明间的相似度: 其中,d为当前正在开发的声明,e为相似项目中待计算相似度的声明,F表示声明中所有调用接口的集合;所述方法根据如下数据处理步骤计算API的评分:topsimd={e|simd,e>μ}根据如下公式计算候选集中的API评分: 其中,Rp,d,i为当前开发者正在开发的项目p中的声明d对API接口i推荐的评分,Re,i为声明e对API接口i调用的次数,为声明e对其调用的所有API接口的平均调用次数,Rd,j为声明d对API接口j调用的次数,为筛选出的相似声明对接口j的平均调用次数,λ为近邻因子,m为相似声明数量,n为候选列表的API接口数量;listi为候选列表中与API接口i相似的接口集合,API接口i,j的相似度为i,j对应的API文档的语义相似度。

全文数据:

权利要求:

百度查询: 南京航空航天大学 一种协同过滤并权衡数据信息的API推荐方法与装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。