一种基于多模态深度学习的冒犯性评论识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：广东工业大学

摘要：本发明公布了一种基于多模态深度学习的冒犯性评论识别方法，具体实现步骤如下：（1）构建冒犯性评论数据集。（2）构建冒犯性评论识别模型：首先运用Bert模型对文本模态数据进行编码，构建快速视觉几何群神经网络对输入的图像模态数据进行特征提取；然后构建门控循环图卷积神经网络融合不同模态的特征向量；最后根据门控循环图卷积神经网络融合得到的特征向量，运用激活函数判断该评论是否具有冒犯性。（3）初始化模型的权重和偏置项设置模型相关的超参数，将训练集和验证集加载至该模型中进行训练，得该模型训练后的最优参数。（4）运用该模型，对评论进行冒犯性识别。

主权项：1.一种基于多模态深度学习的冒犯性评论识别方法，其特征在于从多种模态的信息中提取特征，同时将这些特征划分为多种粒度进行融合，然后使用融合后的特征进行冒犯性评论识别，该方法包括以下步骤：第一步，构建冒犯性评论数据集：首先从利用爬虫爬取数据、整合现有的相关数据集这两个渠道获取原始的冒犯性评论数据，将每一条原始的冒犯性评论数据表示为一个二元组；然后采用人工操作和使用第三方工具包两种方法，根据每一个二元组构建词语集合；接着对原始的冒犯性评论数据进行标注；最后将每一个二元组与其对应的词语集合和标注构造成四元组，所有的四元组构成一个冒犯性评论数据集；所述构建词语集合的两种方法包括人工参照原始冒犯性评论数据二元组总结词语集合、利用FasterR-CNN自动提取出原始冒犯性评论数据二元组中的词语集合；所述构建冒犯性评论数据集的步骤，包括：从利用爬虫爬取数据、整合现有的相关数据集这两个渠道获取原始的冒犯性评论数据；每一条评论表示为一个二元组txt,img，其中第一元txt表示评论中的文本，第二元img表示评论中的图片；采取特定方法从二元组txt,img中提取出图片标签label，label为描述img内容的词语集合，表示为；其中所述的特定方法，包括人工参照txt和 img，描述出该img的label；或者借助第三方工具包从img中描述出label；所述的第三方工具包是一种检测图片中的对象实例的工具包，包括但不限于FasterR-CNN工具包；这种工具包以img为输入，即可自动描述出描述img中的对象实例的label；构建类别标签offensive，采用人工标注的方法，将每个二元组标注为“冒犯”或“非冒犯”类别；由每个二元组txt,img及其对应的label和offensive构造四元组d=txt,img, label,offensive；所有的四元组构成一个数据集，其中n为数据集的评论条数；然后将D按照一定的比例划分为训练集、验证集和测试集；第二步，构建冒犯性评论识别模型：首先运用Bert（BidirectionalEncoderfromTransformers）模型对输入的文本模态数据进行编码，同时构建快速视觉几何群神经网络（Fast-VisualGeometryGroupNetwork，Fast-VGG）对输入的图像模态数据进行特征提取；然后构建门控循环图卷积神经网络（GateRecurrent-GraphConvolutionalNetwork，G-GCN）融合不同模态的特征向量；最后根据G-GCN融合得到的特征向量，运用Sigmoid激活函数判断该评论是否具有冒犯性；所述构建冒犯性评论识别模型的步骤，包括：运用Bert模型对txt和label进行编码，得到txt和label编码后的向量分别表示为和；构建Fast-VGG对img进行特征提取，将img经过Fast-VGG中多层卷积池化处理后得到的特征图利用全局平均池化（GlobalAveragePooling，GAP）进行压缩，得到表示img的特征向量；构建G-GCN融合不同模态的特征向量；根据G-GCN融合得到的特征向量，对评论是否具有冒犯性进行识别；所述构建Fast-VGG的步骤，包括：构造8个卷积层，其卷积核大小为3×3，根据通道数将其划分为4个block，每个block包含2个卷积层，在每个block后连接最大池化层减少参数量；其中第一个block表示为Conv1，与之相邻的block表示为Conv2，与Conv2相邻的block表示为Conv3，与Conv3相邻的block表示为Conv4；在Conv4相邻的最大池化层连接GAP，将卷积层输出的特征图映射为n个1×1向量；将通过GAP池化后得到的n个1×1向量拼接成1个1×n向量作为Fast-VGG输出；所述对img进行特征提取的步骤，包括：构建Fast-VGG，将img作为Fast-VGG的输入，其经过多层卷积池化处理后得到特征图V；将特征图V作为GAP的输入，将其压缩成n个1×1向量放入数组；将D中的所有元素进行向量拼接，得到img的特征向量：其中为权重矩阵，用于对拼接后的向量进行降维；Concat是一个用于向量拼接的函数；所述的构建G-GCN融合不同模态的特征向量的步骤，包括：将和进行向量拼接，得到拼接后的向量；其中为权重矩阵，用于对拼接后的向量进行降维；Concat是一个用于向量拼接的函数；将作为门控循环单元（GateRecurrentUnit，GRU）的输入，提取txt和label中的时序特征；基于label构建一个图G，运用图卷积神经网络GCN（GraphConvolutionalNetworks）去提取label中的空间特征；所述基于label构建一个图G的步骤，包括：将label中的每一个词语作为图的节点，所有的节点构成一个节点集V，将词语之间的相邻关系作为图的边，所有的边构成一个边集E，V和E构成图G=V,E；其中词语之间的相邻关系在这里具体指：label为一个词语集合，关系相近的词语相邻放置；设置一个固定大小能包含2个词语的滑动窗口，窗口中同时存在的词语即为相邻关系，具有相邻关系的词语边的权重设置为1，反之设置为0；使用来初始化图G中所有的节点的向量表示；将GRU提取的时序特征作为粒度，将GCN提取的空间特征作为粒度，将Fast-VGG 提取的图像特征作为粒度，运用Transformer融合多种粒度；其中粒度、为文本模态的特征向量，为图像模态的特征向量；所述的运用Transformer融合多种粒度的步骤，包括：将、、两两之间通过门控注意力机制（Gated-Attention，GA）进行融合，得到不同粒度融合后的粒度、和，其融合过程如下：通过Transformer融合、、：得到融合多种粒度后的特征向量；其中[CLS]为Bert模型中文本的开头符号，用于表示整个文本的语义信息；第三步，设置模型的所有相关参数：设置特征图的维度、学习率的大小、批处理的大小、优化器的选择上述这些与模型相关的参数；将训练集和验证集加载至该模型中进行训练，得该模型训练后的最优参数；第四步，运用该冒犯性评论识别模型，对评论进行冒犯性识别，将测试集输入到训练好的冒犯性评论识别模型中进行测试，使用机器学习中的准确率和MMR作为该冒犯性评论识别模型在执行冒犯性评论识别任务时的评估指标，然后将该冒犯性评论识别模型运用于不同数据集的冒犯性评论识别任务当中。

全文数据：

权利要求：

百度查询：广东工业大学一种基于多模态深度学习的冒犯性评论识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于鲜花售卖的分销管理方法及系统

下一篇：用于CRISPR-CAS系统的电穿孔增强剂

相关技术

一种用于鲜花售卖的分销管理方法及系统

用于CRISPR-CAS系统的电穿孔增强剂

内窥镜光源主机及其摄像系统

一种血管支架系统

像素排布结构、显示面板及显示装置

特异性结合GPRC5D和CD3的抗原结合分子及其医药用途

负载优化的大型滚动轴承装置

一种轨道交通车辆的主被动融合检测系统

一种任务管理方法及相关系统

定子铁芯及定子铁芯的制造方法

用于车辆的制动设备的多活塞断开接合系统、用于车辆的具有多活塞断开接合系统的制动设备以及用于车辆的具有该制动设备的传动装置

一种培养皿装配及码垛一体化设备

冒犯相关技术

中文冒犯性检测模型的训练方法、检测方法、设备及介质_中国电信股份有限公司_202410704133.0

一种多特征融合冒犯性文本检测方法及装置_郑州大学_202410210265.8

一种基于多模态深度学习的冒犯性评论识别方法_广东工业大学_202311340523.6

一种基于多模态深度学习的冒犯性评论识别方法_广东工业大学_202311340523.6

一种基于深度学习的中文冒犯性语言检测方法及系统_新疆大学_202311382250.1

性相关技术

高密封性法兰_浙江晖宇法兰有限公司_202420122397.0

一种局灶性永久性脑缺血实验动物造模组件_上海市普陀区人民医院_201911128769.0

导电性部件、导电性薄膜、显示装置、触摸面板_富士胶片株式会社_201980022800.4

具有高支撑性及导热性的复合挠性覆铜板_广东力王新材料有限公司_202420111876.2

挠性板浸水可靠性的模拟测试方法及装置_中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室))_202410579384.0

深宽比依赖性降低的选择性蚀刻的方法_朗姆研究公司_201780062967.4

放射性核素生成_比利时核研究中心_202280086512.7

非易失性存储电路_索尼半导体解决方案公司_201980015138.X

电性测试的传导装置_全球连接器科技有限公司_201911011982.3

区划适应性视频生成_巴科股份有限公司_201980101989.6

学习相关技术

预测装置、学习装置及学习方法_龟甲万株式会社_202280091168.0

英语分层学习方法及系统_深圳英卓教育科技有限公司_202410776546.X

使用周期数据的机器学习_脸萌有限公司_202380020610.5

一种分数学习盘_福建省诺达轻工股份有限公司_202420254383.4

量化稳健联合机器学习_高通股份有限公司_202380017780.8

信息处理装置、推论装置、机器学习装置、信息处理方法、推论方法及机器学习方法_株式会社荏原制作所_202380020814.9

信息处理装置、推论装置、机器学习装置、信息处理方法、推论方法及机器学习方法_株式会社荏原制作所_202380019756.8

用于整数深度学习原语的动态精度管理_英特尔公司_201810420883.X

一种机器学习多角度扫描装置_南京邮电大学通达学院_202420399308.7

基于机器学习的压缩空气泄漏检测_生态植物科技创新有限公司_202410286957.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于多模态深度学习的冒犯性评论识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务