Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜浙江工业大学钱丽萍获国家专利权

恭喜浙江工业大学钱丽萍获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜浙江工业大学申请的专利一种基于深度学习的中文文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114912461B

龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210614817.2,技术领域涉及:G06F40/30;该发明授权一种基于深度学习的中文文本分类方法是由钱丽萍;钱江;王寅生;张文杰;王倩设计研发完成,并于2022-05-31向国家知识产权局提交的专利申请。

一种基于深度学习的中文文本分类方法在说明书摘要公布了:一种基于深度学习的中文文本分类方法,结合Word2Vec词向量与LDA词向量作为词嵌入以增强文本主题特征;编码阶段将自注意力机制以及RNN网络结合可以实现对文本进行深度语义特征提取的同时保留序列特征。本发明对于输入的一篇中文文本,运用系统模型,能够有效提升文本分类的准确率。本发明融合了Word2Vec词向量与LDA词向量作为词嵌入,并结合了循环神经网络RNN以及自注意力机制Self‑Attention的特征提取优势,极大程度上改善了文本分类准确率,从而使得人们的信息处理效率进一步提升。

本发明授权一种基于深度学习的中文文本分类方法在权利要求书中公布了:1.一种基于深度学习的中文文本分类方法,其特征在于,所述方法包括以下步骤:1首先对输入文本进行预处理操作,过程如下:去除停用词、特殊符号;利用Jieba中文分词工具进行分词处理,得到w1,w2,w3,···,wn,接着运用Word2Vec中文预训练模型输出每一个单词所对应的词向量,用c1,c2,c3,···,cn表示,词向量组c1,c2,c3,···,cn记作矩阵WC;运用训练好的LDA模型输出文本的主题-词矩阵记为WT,最后将矩阵WC和矩阵WT按对应向量进行拼接操作得到n×dmodel维矩阵WE,dmodel为词向量维数,满足WE=[WC,WT]12将矩阵WE输入至编码器,首先进行位置编码得到矩阵P,计算过程说明如下: 3将矩阵P与矩阵WE相加得到最终的n×dmodel维词嵌入矩阵WI,公式如下:WI=WE+P34将矩阵输入WI至自注意力机制,生成n×dmodel维矩阵M,公式如下: Q=WI×WQ5K=WI×WK6V=WI×WV7其中,WQ、WK、WV为可训练dmodel维参数方阵,dk为可调超参数;5将矩阵M和WI进行残差与归一化操作,得到n×dmodel维矩阵N1,公式如下:N1=LayerNormΜ+WI86将矩阵N1输入至前馈神经网络,得到n×dmodel维矩阵F,公式如下:F=max0,N1W1+B1W2+B29其中W1、W2为神经网络权重矩阵,B1、B2为神经网络偏置项;7下一步,将矩阵WI输入至单隐藏层循环神经网络,将每一个时刻隐藏层输出向量保存,记为矩阵R1,dr为RNN网络维数;8将矩阵R1进行线性变换为n×dmodel维矩阵公式如下 其中,WL为dr×dmodel维可训练参数矩阵;9将矩阵F、以及N1进行残差和归一化操作得到矩阵N2,公式如下 10取矩阵N2的首个向量输入至分类器,首先经过前馈神经网络,输出df维向量f,公式如下:f=vCLS·w1+b1w2+b212其中,vCLS为N2的首个向量,w1、w2为神经网络权重,b1、b2为神经网络偏置项,df为神经网络维数;11将向量f元素进行Softmax运算,数值最大的维度便对应文本类别yp,公式如下:yp=softmaxf1312通过交叉熵损失函数来训练模型参数,模型参数包括矩阵元素与神经网络权重及偏置项,损失函数如下所示: 其中,S为训练样本总数,yt为真实类别,yp为预测类别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。