买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国家计算机网路与信息安全管理中心
摘要:本发明提出了针对虚假信息的人机内容判别方法,属于人工智能与信息检测技术领域。本方法,首先进行虚假信息识别与编码,然后进行特征提取与表示,构建虚假信息识别模型。之后进行损失函数与优化。训练模型后,根据训练好的模型,验证集评估模型的准确率和召回率,根据结果调整模型参数。利用模型,输出概率最大的类别。本方法能够自动判别由大型语言模型生成的内容,为生成式模型提供可信保障,可应用于垃圾信息过滤、虚假新闻检测等多个领域,有助于提高信息的质量和安全性。
主权项:1.针对虚假信息的人机内容判别方法,其特征在于,包括以下步骤:步骤1:虚假信息识别与编码;步骤2:特征提取与表示;步骤2.1:使用预训练语言模型;对于每个文本数据x,通过模型提取特征向量以此来获得矢量表示;这一步涉及将文本数据输入BERT模型,并获取最后一层的输出,即v=BERTx;步骤2.2:向量化表示;文本数据x经过BERT模型后,输出一个固定大小的特征向量v,该向量是文本的密集表示,捕捉了文本的语义信息;步骤3:构建虚假信息识别模型;步骤3.1:模型架构;输入层:接收从BERT模型得到的特征向量v;使用子注意力机制和位置编码生成这些特征向量;隐藏层:包含多个全连接层,每层之后使用ReLU激活函数,进一步处理BERT模型输出的特征向量;hl=ReLUWlhl-1+bl其中,l表示层的序号;hl表示第l层的隐藏状态,是前一层经过全连接层和ReLU激活函数计算得到;Wl表示第l层的权重矩阵;bl表示第l层的偏差向量;输出层:包括一个神经元,使用Sigmoid激活函数来预测文本是否包含虚假信息,P虚假|x=SigmoidW0hL+b0,其中L是最后一个隐藏层;P表示最终的预测输出,是虚假信息的概率;采用对比学习的方法,对于任意文本数据x,对比学习方法目的是学习一个encoderf:scorefx,fx+>>scorefx,fx-其中,fx是一个编码器,它将数据x映射到一个嵌入空间;x+是和x相似的样本,被当作正样本;x-是和x不相似的样本,被当作负样本;score得分是两个样本之间相似度的度量;构造一个softmax分类器,正确分类正样本和负样本;鼓励score函数对正样本赋值大于对负样本赋值: 其中,τN为超参数,用于控制负样本的数量;EX表示对x的期望值;fxj表示将输入数据xj映射到嵌入空间;分母项由一个正样本和N-1个负样本组成,使用点乘作为得分函数:scorefx,fx+=fxT,fx+其中,T表示转置;步骤4:损失函数与优化;步骤4.1:设计损失函数;设计一种余弦相似度损失函数: 其中,分别是模型输出的向量和目标向量;通过从1中减去余弦相似度,是为确保当两个向量非常相似,即余弦相似度接近1时,损失接近0,当它们不相似,即余弦相似度远离1时,损失增大;使用二元交叉熵损失函数Losscrossen: 其中,N是训练样本的数量;pi是模型对第i个样本预测为虚假的概率;yi是真实标签;最终损失函数Losstotal如下:Losstotal=μLosscosine+1-μLosscrossen其中,μ是位于0到1之间的权重系数;步骤4.2:使用Adam优化器进行训练;步骤5:训练模型;步骤5.1:平衡采样;采用一个平衡采样器,从除去正样本的L-1个位置中随机选出r个作为负样本;训练过程中,模型每次给出预测值后,都随机采样负样本,并更新采样器的随机种子,确保每次采样的数值都不相等;步骤5.2:计算损失函数loss;在随机挑选出r个负样本后,已经达到了正负样本的相对平衡;使用步骤4自定义的损失函数进行迭代优化;步骤5.3:反向传播;在平衡采样并计算出损失函数loss之后,进行loss的反向传播;重复该过程,直到模型的表现达到要求;步骤6:根据训练好的模型,验证集评估模型的准确率和召回率,根据结果调整模型参数;在该分类问题中,样本一共有两种类别:Positive人工和Negativ机器,分类结果分为以下几种:TruePositive,TP:把正样本成功预测为正;TrueNegative,TN:把负样本成功预测为负;FalsePositive,FP:把负样本错误地预测为正;FalseNegative,FN:把正样本错误的预测为负;在模型中,评价指标Accuracy、Precision、Recall和F1score的定义如下: 首先,根据步骤1和步骤2,得到虚假信息的数字化表示;然后,将得到的数据输入模型,模型进行步骤3和步骤4;最后,输出概率最大的类别。
全文数据:
权利要求:
百度查询: 国家计算机网路与信息安全管理中心 针对虚假信息的人机内容判别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。