买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:腾讯科技(深圳)有限公司
摘要:公开了一种处理文本数据的方法及设备、一种将复杂文本处理模型简化为轻量文本处理模型的方法及设备、和计算机可读存储介质。该处理文本数据的方法包括:获取待分类的文本数据;将所述待分类的文本数据转化为数值向量;利用轻量文本处理模型,将所述数值向量转化为句向量;以及基于所述句向量,确定所述文本数据的类别标签。该方法利用三个支路模型的轻量文本处理模型,能够快速、准确地对文本数据进行识别和分类。
主权项:1.一种将复杂文本处理模型简化为轻量文本处理模型的方法,包括:获取基于第一训练文本库训练的复杂文本处理模型,所述第一训练文本库中的每个样本包括所述样本的文本数据;获取第二训练文本库,所述第二训练文本库中的每个样本包括所述样本的类别标签和所述样本的分词序列,第二训练文本库中的样本量小于第一训练文本库的样本量;利用所述复杂文本处理模型,将第二训练文本库中的样本的分词序列转化为第一样本句向量;以及基于第二训练文本库中的每个样本的类别标签、分词序列和第一样本句向量,训练轻量文本处理模型,其中,所述轻量文本处理模型的复杂度低于复杂文本处理模型。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 处理文本数据的方法及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。