深圳壹账通智能科技有限公司陈家豪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳壹账通智能科技有限公司申请的专利一种文本的分词方法、系统、计算机设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114417854B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111568385.8,技术领域涉及:G06F40/289;该发明授权一种文本的分词方法、系统、计算机设备及存储介质是由陈家豪;徐亮设计研发完成,并于2021-12-17向国家知识产权局提交的专利申请。
本一种文本的分词方法、系统、计算机设备及存储介质在说明书摘要公布了:本发明涉及人工智能技术领域,提供一种文本的分词方法、系统、计算机设备及存储介质,包括:获取待分词的文本;针对所述文本的每句话,按照自左向右的顺序,以结束点为界将该句话分为多个语义块;两个连续的字在待分词的文本所属领域的词表中不存在相连的记录,则将该两个连续字的前一个字记为结束点;对每个语义块进行全切分,得到该语义块的所有可能的切分方式;针对每个语义块所有的切分方式,按照自左向右的顺序进行遍历的概率计算,选择概率最大的一种切分方式,作为最终的分词结果。本发明的分词方案基于概率,在一个块内遍历所有的解,并综合考虑了文本的前后文联系,能够得到更加准确的分词结果,减少了人力成本,提高了分词准确率。
本发明授权一种文本的分词方法、系统、计算机设备及存储介质在权利要求书中公布了:1.一种文本的分词方法,其特征在于,包括: 获取待分词的文本; 针对所述文本的每句话,按照自左向右的顺序,以结束点为界将该句话分为多个语义块,其中,两个连续的字在待分词的文本所属领域的词表中不存在相连的记录,则将该两个连续字的前一个字记为结束点; 对每个语义块进行全切分,得到该语义块的所有可能的切分方式; 针对每个语义块的所有可能的切分方式,按照自左向右的顺序进行遍历的概率计算,选择概率最大的一种切分方式,作为最终的分词结果; 每种切分方式的概率PS|C的表达式为: 其中,PC为语义块C在所属领域的词表中的出现概率,为一个固定值;PC|S为定值1; PS=PW1,W2,…Wn≈PW1×PW2×…×PWn∝logPW1+logPW2+…+logPWn; 其中,PWn为每种切分方式中各词汇在该语义块所属领域的词表中的出现概率; 其中,各领域的词表为预先训练得到,且各领域的词表分别包括多个词汇及各词汇在该领域的出现概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳壹账通智能科技有限公司,其通讯地址为:518066 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励