首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向表格型数据的事实验证方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东南大学

摘要:本发明公开了一种面向表格型数据的事实验证方法,能够用于检验网络上声明的真实性,包括如下步骤:首先针对输入的表格数据和文本声明,利用DeBERTa模型获得单一模态的编码表示;然后将单一模态的编码表示作为交叉模态Transformer模块的输入,分别获得融合模态间信息的表格表示和文本声明表示;最后通过构建一个图神经网络,提取表格的结构信息以及文本的语义信息来进行信息传递和推理;最后利用一个多层感知器获得声明真实性的预测结果,本发明结合图神经网络来对表格数据进行表示,并联合多模态技术增强文本声明和表格数据之间的交互,增强了模型的表示学习能力和推理能力,从而提高了声明真实性预测的准确性。

主权项:1.一种面向表格型数据的事实验证方法,其特征在于,所述方法包括以下步骤:步骤1,获取表格数据和文本声明的单一模态表示,首先通过对表格进行预处理,获得自然语言模型能处理的序列化形式,再通过DeBERTa模型分别获得表格和声明的编码表示,步骤2,将单一模态编码表示输入到模态间交互增强模块,获得模态间信息融合的表示,将步骤1中获得的单一模态编码表示作为交叉模态Transformer模块的初始输入,该模块获得文本声明感知的表格表示以及表格数据感知的声明表示;步骤3,根据表格和声明构建图神经网络,增强模型对表格数据的结构信息表示学习能力以及模型的推理能力,根据表格的不同成分进行组件划分,将各组件构建成不同类型的节点,并通过组件之间的语义关系构建图的边,在此基础上进行图推理操作;步骤4,构造一个多层感知器,MultilayerPerceptron,MLP,作为分类器,将步骤3中获得的图推理表示作为分类器的输入,最终获得对声明的预测分布,其中,步骤3分为以下3个子步骤:子步骤3-1:首先需要进行图的节点定义,此子步骤将表格数据划分为几种不同的组件,一个表格可以划分为以下四类组件:1表格标题是对一张表格的概括,通常展示表格内容描述的主体;2表格内容指的是除去表格标题后的所有内容,一般由多行多列组成;3关键字是对这一行内容的概括描述;4关键值描述的是该主体的具体属性值或者具体的实体;子步骤3-2:图中节点之间的边的定义,节点间的边主要分为以下两组,第一组边基于表格的结构信息构造,这些结构信息主要为上文所描述的表格各组件之间潜在的语义信息,包含四类边:1表格标题节点与表格内容节点之间的边;2关键字节点和对应关键值节点之间的边;3同一列关键值之间的边,第二组边描述的是文本声明和表格数据之间的联系,文本声明节点与每一个表格节点之间存在边;子步骤3-3:生成图中节点的初始化表示,为了获得图节点的初始化表示,该子步骤将步骤2中交叉模态Transformer的输出作为图神经网络中节点的初始表示,由于每个节点代表的是表格中的不同组件,图中各类节点的初始化表示如下所示:S=gmfBiSC[Sstart;Send]8其中fBi·表示BiLSTM网络的输出,gm·表示多层感知器MLP的输出, ki=gmfBiTC[ki;start;ki;end]10vi=gmfBiTC[vi;start;vi;end]11其中[start;end]表示该节点所包含的单词在整个组件中的位置跨度,[Cstart;Cend]表示表格标题的第一个单词所处位置到表格标题最后一个单词位置的跨度,公式中的粗体字符C表示这一串字符通过交叉模态Transformer、BiLSTM和MLP层后获得的固定长度的表示。

全文数据:

权利要求:

百度查询: 东南大学 一种面向表格型数据的事实验证方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。