电子科技大学杨阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于模态间冲突的多模态虚假新闻检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117056736B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310806576.6,技术领域涉及:G06F18/22;该发明授权一种基于模态间冲突的多模态虚假新闻检测方法是由杨阳;李骏;位纪伟设计研发完成,并于2023-06-30向国家知识产权局提交的专利申请。
本一种基于模态间冲突的多模态虚假新闻检测方法在说明书摘要公布了:本发明公开了一种基于模态间冲突的多模态虚假新闻检测方法,通过相似度分数将两种模态即文本和图片间的所有单词‑区域对分割为匹配部分和冲突部分,匹配部分其按余弦相似度聚合,冲突部分按位相加的方式获得片段对的特征表示,然后进行融合得到匹配部分的表示zm和冲突部分的表示zc,并根据这些表示进行分类得到分类结果对于真实新闻,侧重于匹配部分提供的线索,而对于虚假新闻,则侧重于冲突部分提供的线索,这样提高了多模态虚假新闻检测方法正确率。此外,训练过程中,本发明基于匹配部分和冲突部分权重softmax函数,计算均方误差损失函数,并作为损失函数的一部分,这样模态虚假新闻检测方法正确率进一步提高。
本发明授权一种基于模态间冲突的多模态虚假新闻检测方法在权利要求书中公布了:1.一种基于模态间冲突的多模态虚假新闻检测方法,其特征在于,包括以下步骤: 1、特征提取使用特征编码器对多模态新闻进行特征提取,特征编码器包括文本编码器和图像编码器,多模态新闻包含多种不同模态的内容,其中文本和图片分别记为W和R; 对于文本W,首先使用文本编码器提取文本嵌入表示其中,N表示文本W中的单词数,表示文本W中第i个单词提取的特征,为维度dW的列向量,表示dW行、N列的实数矩阵,一列为一个单词的特征,然后再用核大小分为1、2、3的1维卷积网络和一个全连接层,将文本嵌入表示EW映射到维度为d的子空间,得到单词特征其中,ti为特征映射后的特征,为d维的列向量; 对于图像R,首先使用图像编码器提取图像区域嵌入表示其中,M表示图像区域的个数,表示图像R中第j个图像区域提取的特征,为维度dR的列向量,表示dW行、M列的实数矩阵,一列为一个图像区域的特征,然后通过一个全连接层将图像区域嵌入表示映射到维度为d的子空间,得到区域特征其中,vj为特征映射后的特征,为d维的列向量; 2、分割片段对首先,对于单词特征T={t1,t2,…,tN}和区域特征V={v1,v2,…,vM},计算单词‑区域对即片段对的余弦相似度的计算公式为: 其中,上标T表示转置,i∈[1,N],j∈[1,M],sij∈[‑1,1]; 然后,设置一个超参数λ∈[0,1作为阈值,将相似度矩阵S=sijN×M分割为两部分: 其中,Sm表示匹配部分,Sc表示冲突部分; 3、融合对于匹配部分Sm,如果有相似度矩阵S中第i行的余弦相似度sij,则参照注意力机制将其按余弦相似度聚合: 其中,表示包含了图像模态互补信息的单词特征表示,σ表示softmax函数; 对于冲突部分Sc的余弦相似度sij,采用按位相加的方式获得片段对的特征表示: cij=ti⊕vj采用两个多层感知机网络分别计算单词特征表示的一致性分数以及特征表示cij的冲突分数其中,MLP表示多层感知机网络,sigmoid表示激活函数; 将匹配部分以及冲突部分包含余弦相似度分别按对应的分数进行融合,从而获得匹配部分的表示zm和冲突部分的表示zc: 4、分类首先,对于匹配部分和冲突部分,采用以下分类器分别学习其权重: 其中,wm为匹配部分权重,wc为冲突部分权重,Wz和bz为分类器可训练的参数,Wz为d维度的行向量,bz为偏置,表示拼接即匹配部分权重wm与冲突部分权重wc作为两个元素组成一个二维行向量,σ表示softmax函数,其值wmc是一个二维行向量即1×2的矩阵; 然后,按权重相加得到多模态新闻的多模态表示z,并获得分类结果其中,表示拼接即匹配部分的表示zm和冲突部分的表示zc作为两列构成一个d×2的矩阵,得到的多模态表示z为1×d的矩阵,为分类器可训练参数,为df×d的矩阵,为df×1的矩阵,ReLU为修正线性单元,为2×df的矩阵,为2×1的矩阵,分类结果为一个二维行向量即1×2的矩阵,其第一、二元素值分别表示该多模态新闻是真和假的分数值; 5、训练针对分类结果计算其与多模态新闻标签y的交叉熵损失函数L1,同时针对二维行向量wmc,计算其与区域标签yp的均方误差损失函数L2,得到训练分类器的损失函数L=L1+L2,并依据损失函数L对分类器进行训练,更新整个模型的可训练参数,其中,真实多模态新闻的标签y为[1,0],对应的区域标签yp为[1,0],虚假多模态新闻的标签y为[0,1],对应的区域标签yp为[0,1]; 6、检测对于多模态新闻,按照步骤1至4的方法进行处理,得到分类结果如果其中假的分数值大于真的分数值,则认为是虚假新闻,否则,认为是真实新闻。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。