恭喜北京华宇信息技术有限公司沈哲吉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京华宇信息技术有限公司申请的专利输入法多元词发现方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113204963B 。
龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110493402.X,技术领域涉及:G06F40/289;该发明授权输入法多元词发现方法及装置是由沈哲吉;贾昌鑫;鲍宁;孙明东设计研发完成,并于2021-05-07向国家知识产权局提交的专利申请。
本输入法多元词发现方法及装置在说明书摘要公布了:本申请提供一种输入法多元词发现方法及装置,用于解决输入法发现多元词效率低的技术问题。其中,一种输入法多元词发现方法,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;以WFP数据结构存储分词单元;通过读取WFP数据结构,比较分词单元与分词单元的关联性,确定分词单元组合;添加所述分词单元组合至词库。相对于现有技术,所述输入法多元词发现方法能实现多元词关系的发现,并且提高了发现多元词的准确率、效率。
本发明授权输入法多元词发现方法及装置在权利要求书中公布了:1.一种输入法多元词发现方法,其特征在于,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;以WFP数据结构存储分词单元;通过读取WFP数据结构,比较分词单元与分词单元的关联性,确定分词单元组合;添加所述分词单元组合至词库;其中,所述以WFP数据结构存储分词单元,具体包括:构建字符索引表和频次特征树,生成初始WFP数据结构;将若干分词单元构成的语句逻辑体导入初始WFP数据结构,生成最终WFP数据结构;其中,频次特征树由若干个节点构成,所述频次特征树用于描述分词单元在语料数据的词频信息;所述节点存在前项索引集合、后项索引集合、当前节点的分词单元,以及当前节点词频;字符索引表由若干个字符索引组成,单个字符索引代表唯一对应的一个分词单元;字符索引用于记录节点在的频次特征树中的位置信息;其中,所述通过读取WFP数据结构,比较分词单元与分词单元的关联性,确定分词单元组合,具体包括:根据WFP数据结构,构建多元词关系表;通过扫描多元词关系表,计算分词单元与分词单元的扩充信息熵;当所述分词单元与分词单元的扩充信息熵小于或等于第一预设阈值,确定分词单元组合;其中,所述多元词关系表描述分词单元组合关联性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京华宇信息技术有限公司,其通讯地址为:100084 北京市海淀区中关村东路1号院8号楼21层C2301、C2302;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。