买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海工程技术大学
摘要:本发明公开了基于关键词Trie树消除GCC抽象语法树冗余的方法,步骤为:通过GCC编译器编译源码文件得到原始数据;对原始数据进行文本预处理即对原始数据进行数据清洗后根据GCC抽象语法树节点自上而下递增存储的逻辑结构将一节点的数据存储为一单元;用有用节点信息关键词Trie树对上步所得数据进行检索输出有效节点及其子节点信息,完成GCC抽象语法树冗余消除;关键词Trie树是依据有用节点关键词词库建立的,有用节点关键词词库是通过对基准文本库中的文本进行文本预处理后构造得到的,其包括GCC抽象语法树文本文件的编译产生的有效节点类型。本发明的处理过程简单,数据处理量小,处理速度快,去除冗余效率及查准率高。
主权项:1.基于关键词Trie树消除GCC抽象语法树冗余的方法,应用于电子设备,其特征在于,首先构造GCC抽象语法树文本文件的编译产生的有效节点类型以及与源文件相关的有用节点关键词词库,然后构建一棵基于有用信息关键词词库的Trie树算法,将有用节点关键词的第一个关键字母按照英文字母表进行排列,在检索到相同前缀关键词时仅需存储在相同的前驱节点,接着对已进行文本预处理的GCC抽象语法树文本即待处理文本进行有效信息关键词检索,将检索到包含有效信息字段的节点进行输出,最后将上一步输出的节点中子节点信息也输出,得到消除冗余后的GCC抽象语法树文本;其步骤如下:(1)通过GCC编译器编译源码文件得到原始数据;(2)对原始数据进行文本预处理,所述文本预处理是指对原始数据进行数据清洗后根据GCC抽象语法树节点自上而下递增存储的逻辑结构将一个节点的数据存储为一个单元;(3)利用有用节点信息关键词Trie树对步骤(2)得到的数据进行检索输出有效节点,再输出有效节点中的子节点信息,即完成GCC抽象语法树冗余的消除,所述有效节点为包含有效信息字段的节点;所述有用节点信息关键词Trie树是依据有用节点关键词词库建立的,所述有用节点关键词词库是通过对基准文本库中的文本进行文本预处理后构造得到的,所述有用节点关键词词库包括GCC抽象语法树文本文件的编译产生的有效节点类型;所述基准文本库是基于当前的GCC抽象语法树文本文件大数据库建立的,按照当前某类型GCC抽象语法树文本文件的使用率选取文本。
全文数据:
权利要求:
百度查询: 上海工程技术大学 基于关键词Trie树消除GCC抽象语法树冗余的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。