腾讯科技(深圳)有限公司刘志煌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯科技(深圳)有限公司申请的专利一种文本类别的确定方法、相关装置以及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113821590B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110662917.8,技术领域涉及:G06F16/334;该发明授权一种文本类别的确定方法、相关装置以及设备是由刘志煌设计研发完成,并于2021-06-15向国家知识产权局提交的专利申请。
本一种文本类别的确定方法、相关装置以及设备在说明书摘要公布了:本申请实施例公开了一种应用于自然语言处理的文本类别的确定方法、相关装置以及设备,用于提高确定文本类别的准确率,从而便于文本的分类或查询。本申请实施例方法包括:获取待分类文本,从待分类文本中确定主题词语,主题词语用于表示待分类文本的主题类型,根据P个领域词典确定待分类文本中的K个领域词语,K个领域词语来源于P个领域词典,领域词语用于表示待分类文本所属的领域类型,每个领域词典对应于一个文本类别,根据K个领域词语以及主题词语确定待分类文本分别属于P个文本类别的概率,根据待分类文本分别属于P个文本类别的概率,从P个文本类别中确定待分类文本所对应的目标文本类别。
本发明授权一种文本类别的确定方法、相关装置以及设备在权利要求书中公布了:1.一种文本类别的确定方法,其特征在于,包括: 获取待分类文本,其中,所述待分类文本包括多个词语; 从所述待分类文本中确定主题词语,其中,所述主题词语用于表示所述待分类文本的主题类型; 根据P个领域词典确定所述待分类文本中的K个领域词语,其中,所述K个领域词语来源于所述P个领域词典,领域词语用于表示所述待分类文本所属的领域类型,每个领域词典对应于一个文本类别,所述P与所述K均为大于或等于1的整数; 根据第一概率映射关系获取所述主题词语在文本集合中的第一特征出现概率,其中,所述第一概率映射关系包括主题词语特征与所述第一特征出现概率之间的对应关系,所述主题词语与所述主题词语特征具有对应关系; 根据所述P个领域词典,确定所述K个领域词语中的P组待选领域词语,每组待选领域词语中包括至少1个领域词语; 根据第二概率映射关系获取所述P组待选领域词语在文本集合中的P个第二特征出现概率,其中,所述第二概率映射关系包括文本局部特征与所述第二特征出现概率之间的对应关系,所述文本局部特征与待选领域词语具有对应关系; 根据所述第一特征出现概率、所述P个第二特征出现概率、分类概率以及贝叶斯模型,得到P个文本类别的概率,其中,所述分类概率来源于N个预设的文本类别,每个分类概率对应一个文本类别,所述N为大于1的整数; 根据所述待分类文本分别属于P个文本类别的概率,从所述P个文本类别中确定所述待分类文本所对应的目标文本类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。