Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 武汉大学沈志东获国家专利权

武汉大学沈志东获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉武汉大学申请的专利一种基于对抗训练和TF-IDF的文本情感分类方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115309894B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210818922.8,技术领域涉及:G06F16/353;该发明授权一种基于对抗训练和TF-IDF的文本情感分类方法及装置是由沈志东;袁芙蓉设计研发完成,并于2022-07-12向国家知识产权局提交的专利申请。

一种基于对抗训练和TF-IDF的文本情感分类方法及装置在说明书摘要公布了:本发明公开了一种基于对抗训练和TF‑IDF的文本情感分类方法及装置,针对文本情感分类任务,分别从生成可解释的对抗样本和文本特征提取两个角度进行研究,确保深度神经网络模型提高分类准确率的同时提高对抗样本的可解释性。对于如何在模型训练过程中生成可解释对抗样本这一问题,本发明针对性地提出将对抗训练应用于BERT嵌入层,将文本单词的扰动方向规范到嵌入空间中现有近邻词的方向来提高对抗样本的可解释性;对于如何提取更多文本特征,本发明提出使用注意力机制和改进的TF‑IDF算法来获得额外的文本特征,从而使得模型能够得出更加全面、准确的文本情感倾向。

本发明授权一种基于对抗训练和TF-IDF的文本情感分类方法及装置在权利要求书中公布了:1.一种基于对抗训练和TF-IDF的文本情感分类方法,其特征在于,包括: S1:获取原始文本,从原始文本中划分出训练集; S2:对训练集进行预处理; S3:构建基于对抗训练和TF-IDF的文本情感分类模型,模型包括嵌入模块、第一特征提取模块、第二特征提取模块和预测模块,其中,嵌入模块采用对抗训练生成对抗文本,将对抗文本与输入文本合并作为输入词向量表示;第一特征提取模块采用双向长短时记忆网络模型,以嵌入模块的输出作为输入提取文本特征,然后采用注意力机制对双向长短时记忆网络模型中的隐藏状态进行加权,为每个隐藏状态给予不同的权重;第二特征提取模块对输入的单词采用改进的TF-IDF算法求得各个单词在每个类别中出现的频率权重,并使用双向长短时记忆网络来进一步提取文本特征,预测模块用于根据第一特征提取模块、第二特征提取模块的输出得到分类结果,嵌入模块的处理过程包括: 将原始文本进行预处理后得到的向量作为BERT预训练模型的输入,原始文本进行预处理后得到的向量包括句子的词向量、段向量和位置编码向量; 利用BERT预训练模型预测词汇表中单词在一个句子中对应位置所出现的概率,具体为:求出一个句子中每个单词的前个近邻词向量,记为; 分别求得每个单词与个近邻词向量之间的方向表示,并得到词向量的对抗扰动: 其中t表示句子中的第t个单词的向量,k表示第k个近邻词向量,|K|表示近邻词向量个数,表示单词t扰动到近邻词k的权重向量; 句子的词向量的基础上添加扰动向量得到对抗词向量,作为对抗样本,其计算方式为: 其中表示句子中的第t个单词的向量,T表示句子中的词向量个数,为对抗样本,并通过求梯度来求得最优的扰动方向: 其中作为输入,表示标签,表示模型参数,表示单个数据的损失函数,表示对抗扰动的阈值,表示梯度,表示所有连接,; 将原始文本进行预处理后得到的词向量和对抗样本输入到BERT编码器,得到包含上下文语义的词向量表示; S4:基于预处理后的训练集对文本情感分类模型进行训练,得到训练好的文本情感分类模型; S5:利用训练好的文本情感分类模型进行文本情感分类。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区珞珈山街道八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。