基于Bert-LSTM的文本多特征分类方法及装置

导航：龙图腾网> 最新专利技术> 基于Bert-LSTM的文本多特征分类方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨工程大学

摘要：本发明公开了一种基于Bert‑LSTM的文本多特征分类方法及装置，属于文本分类技术领域，其中，该方法包括：确定待分类文本数据集，并划分为训练集和测试集；构建基于Bert‑LSTM的文本多特征分类模型；利用训练集对文本多特征分类模型进行训练，得到最优文本多特征分类模型；将待分类文本数据输入最优文本多特征分类模型中，计算待分类文本数据的得分，根据得分将其划分到预设对应类别中。该方法使用BERT以及双向长短期记忆网络等构建基于Bert‑LSTM的文本多特征分类模型，利用挖掘文本多方面的词特征信息和词义潜在语义表示特征信息，融入文本向量，模型在训练过程中充分利用多特征信息，提升了文本分类的性能。

主权项：1.一种基于Bert-LSTM的文本多特征分类方法，其特征在于，包括以下步骤：步骤S1，获取文本数据信息确定待分类文本数据集，并划分为训练集和测试集；步骤S2，构建基于Bert-LSTM的文本多特征分类模型；步骤S3，利用所述训练集对所述基于Bert-LSTM的文本多特征分类模型进行训练，得到最优文本多特征分类模型；步骤S4，将待分类文本数据输入所述最优文本多特征分类模型中，计算所述待分类文本数据的得分，根据所述得分将其划分到预设对应类别中；所述步骤S2的具体构建过程为：步骤S201，使用BERT模型的全词遮蔽WWM-EXT模型，引入Attention机制，从不同维度提取所述文本数据信息的部分特征生成文本句子向量，并融入部分上下文信息，得到高维向量矩阵；步骤S202，通过PCA主成分分析技术对所述高维向量矩阵进行降维，得到低维向量矩阵；步骤S203，构建Bi-LSTM网络，捕捉文本上下文依赖特征信息，并融入文本向量，得到具备上下文依赖的文本句子向量；步骤S204，构建Tree-LSTM网络，以所述低维向量矩阵为输入捕捉文本潜在词性信息，并融入文本向量，得到具备文本潜在词性信息的文本句子向量；步骤S205，将所述具备上下文依赖的文本句子向量和所述具备文本潜在词性信息的文本句子向量进行Concat拼接，得到多特征文本向量表示；步骤S206，将所述多特征文本向量表示输入RCNN卷积神经网络中，得到最终文本向量表示，从而完成所述基于Bert-LSTM的文本多特征分类模型的构建。

全文数据：

权利要求：

百度查询：哈尔滨工程大学基于Bert-LSTM的文本多特征分类方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种音频信号的处理方法、装置、系统和智能音箱设备

下一篇：监控视频的轮巡控制方法、装置、设备及存储介质

相关技术

一种音频信号的处理方法、装置、系统和智能音箱设备

监控视频的轮巡控制方法、装置、设备及存储介质

一种变压器电磁温度流体多物理场间接耦合计算方法及系统

云计算架构多租户任务资源分配调度方法及装置

碳化硅半导体装置及其制造方法

电池、用电设备、制备电池的方法和设备

用于确定泡沫生产的参数的系统和方法

具备适应不同体型患者的呼吸内科胸腔穿刺辅助装置

一种汽车电子设备和菊花链通信的超时复位系统

一种金属镱的显微组织显示方法

一种燃料舱搭载精度控制方法和燃料舱

一种身份认证方法、系统、电子设备及存储介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于Bert-LSTM的文本多特征分类方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务