买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳市云希谷科技有限公司
摘要:本发明提供的一种用于扫描笔的Trie树结构、创建方法、分词方法及系统,通过对Trie树的结构进行重新设计,每个Trie树的子结点仅仅占用14字节的空间,以此大幅缩减了Trie树所占用的整体空间,并且简化了AC自动机的运行逻辑,使得其可以快速匹配所需匹配的字符,当进行分词操作时,仅需要确定是否存在下一子结点,并且根据所求得的余数直接定位到目标节点,无需遍历整个Trie树或者是完整查找多个分枝,大大节省了匹配时间,提高分词效率。并且,通过本发明提供的Trie树结构以及改进的AC自动机,使得该Trie树可以以文件的形式保存,在此基础上,仍然可以以较快的速度实现分词,提高了小型嵌入式设备分词的效率和准确率。
主权项:1.一种用于扫描笔的Trie树结构,包括根结点和子结点,其特征在于:所述根结点具有第一结构数据,所述子结点具有第二结构数据;所述第一结构数据包括:子结点数字段、子结点索引字段;所述第二结构数据包括:编码字段、结束标识字段、fail索引字段、碰撞字段、子结点数字段、子结点索引字段。
全文数据:
权利要求:
百度查询: 深圳市云希谷科技有限公司 一种用于扫描笔的Trie树结构、创建方法、分词方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。