买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:一种软件相似度检测方法及系统,先使用APK逆向工具对APP进行逆向工程得到解包信息;对于两个待比较的APP软件,从数字签名、应用权限、应用框架、代码与敏感信息、应用界面截图、混合画像标签体系以及开发团队与初装用户七大维度进行比较,最后加权得到相似度指标。本发明从多维度深层次地比对两个或多个软件安装包的框架的相似性以及内容的相似性,更高效地判断软件之间的相似性程度,以及同源性程度,准确定位软件之间的联系。
主权项:1.一种软件相似度检测方法,其特征在于,先使用APK逆向工具对APP进行逆向工程得到解包信息;对于两个待比较的APP软件,从数字签名、应用权限、应用框架、代码与敏感信息、应用界面截图、混合画像标签体系以及开发团队与初装用户七大维度进行比较,最后加权得到相似度指标;所述的数字签名,采用文件的数据签名与作者的签名相结合的手段,当两者均相同时,则判断为完全相同,当其中有任意一个相同时,则判断为有较强的相似性,当两者均不相同时,则判断为不同;所述的应用框架,具体通过以下方式得到其相似度:依次判定APK的语言是否为一致以及判断软件APK解包后的文件目录结构是否相似,利用APK解包后的文件目录结构,将其转化为应用框架的有向图,训练图神经网络进行框架类型的比对得到相似度;所述的代码与敏感信息,即存在于代码中的姓名、电话、邮箱、银行卡号、身份证号、IP地址、域名地址、SDK其他具有确定人物、地点、IP定位、提供服务的企业信息,采用关键信息抽取技术抽取得到;所述的应用界面截图,具体通过以下方式得到其相似度:5.1对应用程序的主要的运行界面,分别在在模拟器中对APK进行安装和运行,截取主要的运行截图,其中启动页、引导页、登录页、注册页、主界面、个人中心为最重要的页面,若APP中存在则必须进行采集,其余界面则根据应用的总界面数多少决定采集的个数,但最少采集一页;5.2对两个APP的启动页、引导页、登录页、注册页、主界面、功能导航页、个人中心七大运行页面分别进行截图保存,运用深度学习CLIP算法分别将对应页面进行相似度分数计算,得出相应的分数;5.3当APP中上述七大页面存在缺失或原本APP中没有设计相关界面的情况,计该页面的相似度为0;若对应页面相似度分数超过某一阈值,可计该页面的相似度为1;若两个APP均不含该页面,则忽略该页面的权重,可提高其他页面的权重;5.4通过加权的方式将所有页面的分数累加;所述的混合画像标签体系,具体通过以下方式得到其相似度:将软件用户画像标签、软件功能标签、软件应用市场标签、软件常用设备标签纳入混合画像标签体系,从软件的功能、用户群体、市场占有和常用机型出发,发掘软件之间的相似度;所述的开发团队与初装用户,具体通过以下方式得到其相似度:根据APP软件初装用户的个人信息及Wi-Fi共网情况进行分析,确认开发团队和初始的测试人员与安装人员的相似度判断软件之间有无相似性,具体包括:7.1设置收集软件APP初次安装的50位用户信息阈值可根据实际情况修改,包括初次安装后的IP地址信息、Wi-Fi地址信息、安装时间信息;7.2训练时空图相似性网络将初装用户的时间维度和定位信息维度相结合,输出开发团队开发及测试人员与初装用户的相似性得分,针对在一些复杂场景下例如:同一家企业的不同产品、正版与仿冒APP的比对情况,能更好地反应软件之间开发、测试周期或人员间的相似度。
全文数据:
权利要求:
百度查询: 上海市刑事科学技术研究院 软件相似度检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。