针对虚假信息的人机内容判别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：国家计算机网路与信息安全管理中心

摘要：本发明提出了针对虚假信息的人机内容判别方法，属于人工智能与信息检测技术领域。本方法，首先进行虚假信息识别与编码，然后进行特征提取与表示，构建虚假信息识别模型。之后进行损失函数与优化。训练模型后，根据训练好的模型，验证集评估模型的准确率和召回率，根据结果调整模型参数。利用模型，输出概率最大的类别。本方法能够自动判别由大型语言模型生成的内容，为生成式模型提供可信保障，可应用于垃圾信息过滤、虚假新闻检测等多个领域，有助于提高信息的质量和安全性。

主权项：1.针对虚假信息的人机内容判别方法，其特征在于，包括以下步骤：步骤1：虚假信息识别与编码；步骤2：特征提取与表示；步骤2.1：使用预训练语言模型；对于每个文本数据x，通过模型提取特征向量以此来获得矢量表示；这一步涉及将文本数据输入BERT模型，并获取最后一层的输出，即v＝BERTx；步骤2.2：向量化表示；文本数据x经过BERT模型后，输出一个固定大小的特征向量v，该向量是文本的密集表示，捕捉了文本的语义信息；步骤3：构建虚假信息识别模型；步骤3.1：模型架构；输入层：接收从BERT模型得到的特征向量v；使用子注意力机制和位置编码生成这些特征向量；隐藏层：包含多个全连接层，每层之后使用ReLU激活函数，进一步处理BERT模型输出的特征向量；hl＝ReLUWlhl-1+bl其中，l表示层的序号；hl表示第l层的隐藏状态，是前一层经过全连接层和ReLU激活函数计算得到；Wl表示第l层的权重矩阵；bl表示第l层的偏差向量；输出层：包括一个神经元，使用Sigmoid激活函数来预测文本是否包含虚假信息，P虚假|x＝SigmoidW0hL+b0，其中L是最后一个隐藏层；P表示最终的预测输出，是虚假信息的概率；采用对比学习的方法，对于任意文本数据x，对比学习方法目的是学习一个encoderf：scorefx,fx+＞＞scorefx,fx-其中，fx是一个编码器，它将数据x映射到一个嵌入空间；x+是和x相似的样本，被当作正样本；x-是和x不相似的样本，被当作负样本；score得分是两个样本之间相似度的度量；构造一个softmax分类器，正确分类正样本和负样本；鼓励score函数对正样本赋值大于对负样本赋值：其中，τN为超参数，用于控制负样本的数量；EX表示对x的期望值；fxj表示将输入数据xj映射到嵌入空间；分母项由一个正样本和N-1个负样本组成，使用点乘作为得分函数：scorefx,fx+＝fxT,fx+其中，T表示转置；步骤4：损失函数与优化；步骤4.1：设计损失函数；设计一种余弦相似度损失函数：其中，分别是模型输出的向量和目标向量；通过从1中减去余弦相似度，是为确保当两个向量非常相似，即余弦相似度接近1时，损失接近0，当它们不相似，即余弦相似度远离1时，损失增大；使用二元交叉熵损失函数Losscrossen：其中，N是训练样本的数量；pi是模型对第i个样本预测为虚假的概率；yi是真实标签；最终损失函数Losstotal如下：Losstotal＝μLosscosine+1-μLosscrossen其中，μ是位于0到1之间的权重系数；步骤4.2：使用Adam优化器进行训练；步骤5：训练模型；步骤5.1：平衡采样；采用一个平衡采样器，从除去正样本的L-1个位置中随机选出r个作为负样本；训练过程中，模型每次给出预测值后，都随机采样负样本，并更新采样器的随机种子，确保每次采样的数值都不相等；步骤5.2：计算损失函数loss；在随机挑选出r个负样本后，已经达到了正负样本的相对平衡；使用步骤4自定义的损失函数进行迭代优化；步骤5.3：反向传播；在平衡采样并计算出损失函数loss之后，进行loss的反向传播；重复该过程，直到模型的表现达到要求；步骤6：根据训练好的模型，验证集评估模型的准确率和召回率，根据结果调整模型参数；在该分类问题中，样本一共有两种类别：Positive人工和Negativ机器，分类结果分为以下几种：TruePositive，TP：把正样本成功预测为正；TrueNegative，TN：把负样本成功预测为负；FalsePositive，FP：把负样本错误地预测为正；FalseNegative，FN：把正样本错误的预测为负；在模型中，评价指标Accuracy、Precision、Recall和F1score的定义如下：首先，根据步骤1和步骤2，得到虚假信息的数字化表示；然后，将得到的数据输入模型，模型进行步骤3和步骤4；最后，输出概率最大的类别。

全文数据：

权利要求：

百度查询：国家计算机网路与信息安全管理中心针对虚假信息的人机内容判别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种高纯锆靶材及其制备方法和应用

下一篇：路径规划方法、系统、设备及计算机可读存储介质

相关技术

一种高纯锆靶材及其制备方法和应用

路径规划方法、系统、设备及计算机可读存储介质

一种用于实现低速清扫车自动行驶系统的方法

一种电网高影响天气特征与模式识别方法及系统

马达

一种沙门氏菌预富集培养基及其制备方法和在即食调味品中的应用

一种动态自由视点图像合成方法、系统、设备及存储介质

多通阀、热管理系统和车辆

一种流量计标定装置及标定方法

一种热网加热器换热管泄漏在线定位系统及方法

适用于不同功能空间声场控制的音频处理系统及方法

电信网元实时处理方法、装置、设备、介质及程序产品

信息相关技术

信息处理程序、信息处理方法和信息处理系统_CY游戏公司_202380030937.0

信息处理程序、信息处理方法和信息处理系统_CY游戏公司_202380030934.7

信息提供系统、信息提供方法以及信息提供程序_三菱电机株式会社_202280094451.9

信息处理程序、信息处理方法以及信息处理装置_富士通株式会社_202280094203.4

信息转换系统、信息处理装置、信息处理方法及程序_佳能株式会社_202380030249.4

信息提供装置、信息提供方法以及信息提供程序_NTT通信公司_202380029533.X

信息处理方法及信息处理装置_日产自动车株式会社_202280094468.4

信息处理装置、信息处理方法及程序_古河电气工业株式会社_202380032075.5

信息收集系统、检查用基板以及信息收集方法_东京毅力科创株式会社_202410556494.5

信息处理设备，信息处理方法和程序_索尼公司_202410970547.8

判别相关技术

一种判别滑坡变形机制的方法_中国电建集团成都勘测设计研究院有限公司_202411037633.X

基于图像的抗VEGF指征判别方法、装置及电子设备_北京大恒普信医疗技术有限公司_202011464274.8

一种基于图像特征的绿茶杀青程度判别方法_中华全国供销合作总社杭州茶叶研究所_202410898372.4

基于测井曲线的砂砾岩母岩类型概率判别方法_中国石油化工股份有限公司_202310543910.3

一种超临界相变微观测试与判别方法_北京理工大学_202411026668.3

一种判别核桃油氧化劣变的方法_昆明理工大学_202411256517.7

一种前寒武系碳酸盐岩的大气水改造判别方法_中国石油化工股份有限公司_202411046706.1

一种可重复使用火箭允许点火判别方法及系统_航天科工火箭技术有限公司_202410712319.0

雷电预警判别及解除方法、系统、计算机设备和存储介质_贵州电网有限责任公司_202211228373.5

一种用于技能评价的叉车货物摆放位置判别装置_上海市特种设备监督检验技术研究院_202420777429.0

人机相关技术

无人机套件_深圳莲偶科技有限公司_202323349631.8

基于无人机的车牌识别方法、装置、无人机及存储介质_思翼科技(深圳)有限公司_202411399829.3

无人机跟踪方法、装置、无人机和存储介质_北京卓翼智能科技有限公司_202411445532.6

无人机缓冲气囊舱盖开启机构和包括该机构的无人机_西安科为实业发展有限责任公司_202420179047.8

一种人机界面设备及人机界面方法_岂寅游戏科技有限公司_202280093271.9

无人机的动力机构和无人机_广州极飞科技股份有限公司_202010955707.3

一种剪刀式无人机机臂结构及无人机_普宙科技有限公司_202411212201.8

一种可收缩无人机旋翼防护装置及无人机_科硕大成航空科技(成都)有限公司_201810936269.9

筒射无人机系统_中电长城圣非凡信息系统有限公司_202420612084.3

防滴阀及无人机_南京拓攻自动驾驶技术研究院有限公司_202211185811.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

针对虚假信息的人机内容判别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务