北方工业大学李欣获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北方工业大学申请的专利一种采用多头注意力进行多级特征融合抽取的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117312487B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311277971.6,技术领域涉及:G06F16/31;该发明授权一种采用多头注意力进行多级特征融合抽取的方法是由李欣;邵靖淇;段建勇;何丽;王昊;张晴;肖彬;武志刚设计研发完成,并于2023-09-28向国家知识产权局提交的专利申请。
本一种采用多头注意力进行多级特征融合抽取的方法在说明书摘要公布了:一种采用多头注意力进行多级特征融合抽取的方法,涉及信息抽取领域,包括:获取句子中每个单词的上下文表示并进行识别;利用识别结果计算每对单词的评分向量;计算标签概率;对二维表格进行填充并训练;解码出谓词并过滤掉其他成分;使用多级特征融合器串联特征并将其作为迭代抽取的输入;使用迭代抽取建模每次抽取之间固有的依赖关系,即利用多头注意力模块进行参数提取、标签分类和标签嵌入,获取每个单词在此次抽取的上下文嵌入,通过多级特征融合器将其与其它特征进行串联并作为下一次迭代抽取的输入,重复抽取直至抽取完所有谓词。本发明降低了抽取结果的冗余度,提高了抽取结果的覆盖度和实用性,有助于抽取结果在下游任务中的应用。
本发明授权一种采用多头注意力进行多级特征融合抽取的方法在权利要求书中公布了:1.一种采用多头注意力进行多级特征融合抽取的方法,其特征在于,包括以下步骤: S1、将给定的句子输入至预训练语言模型获取每个单词的上下文表示,并对其进行识别; S2、将上述识别结果输入到双仿射注意力模块中,计算每对单词的评分向量; S3、将上述评分向量输入到Softmax函数中,计算标签概率; S4、利用上述标签概率对二维表格进行填充,并对其进行训练; S5、利用谓词成分抽取器计算二维表格的相邻行和列之间的距离找到组成成分的边界,为每个跨度分配一个标签,解码出谓词并过滤掉其他成分; S6、使用多级特征融合器串联特征特征Hp和特征Epos,特征表示句子经过谓词成分抽取器的最终隐藏状态,特征Hp表示谓词位置隐藏状态下的算数平均向量,特征Epos表示二进制值的谓词位置嵌入; S7、将串联后的特征X作为多头注意力模块的Query即Xq,将串联后的特征X在谓词位置派生出来的子集作为多头注意力模块的Key-Vaule即Xk和Xv; S8、对于含有多个谓词的句子,使用迭代抽取的方法在无需重新编码的情况下建模每次抽取之间固有的依赖关系,获取每个头部的注意力; S9、将上述每个头部的注意力输出连接起来并进行线性转换;将最后的输出结果输入到标签分类器中进行标签分类; S10、经过步骤S9为每个单词标记与进行此次迭代抽取的谓词之间的关系标签,获取每个单词在此次抽取的上下文嵌入,对于每个单词hn,每次抽取的谓词都有不同的上下文嵌入,将其记为特征m为谓词数,通过多级特征融合器将该特征与其它特征进行串联并作为下一次迭代抽取的输入,重复上述过程直至抽取完所有谓词。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北方工业大学,其通讯地址为:100144 北京市石景山区晋元庄路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。