华东师范大学黄宇海获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华东师范大学申请的专利基于小样本的金融事件抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116663540B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310700086.8,技术领域涉及:G06F40/279;该发明授权基于小样本的金融事件抽取方法是由黄宇海;邵旭;曾文秋;朱冰;徐亮亮;曹晓欢;杜威;刘燕婷;吴苑斌;王晓玲设计研发完成,并于2023-06-13向国家知识产权局提交的专利申请。
本基于小样本的金融事件抽取方法在说明书摘要公布了:本发明公开了一种基于小样本的金融事件抽取方法,根据实际需要确定金融事件和需要抽取的要素,包括触发词和若干事件论元,构建包括额外数据编码模块、要素分类器、语句重构模块、重构语句编码器、关系分类器和事件解码模块的事件要素抽取模型并采用训练样本进行训练,当需要对某条语句进行金融事件抽取时,将对应词语序列输入训练好的事件要素抽取模型,预测得到该语句所包含的要素以及存在触发词‑事件论元关系的要素对,筛选出出现频率最高的要素作为触发词、其他要素作为事件论元,构成金融事件。本发明将金融事件抽取任务与小样本进行结合,使得事件抽取模型能够使用少量的训练样本就能够得到拥有使用接近足量训练样本训练的性能。
本发明授权基于小样本的金融事件抽取方法在权利要求书中公布了:1.一种基于小样本的金融事件抽取方法,其特征在于,包括以下步骤: S1:根据实际需要确定金融事件,并确定需要抽取的要素,包括触发词和若干事件论元; 收集所确定金融事件的若干条语句,并对所收集的语句采用预设的预处理方法进行预处理;对于预处理后语句提取得到对应的词语序列,记语句的词语序列为S={x1,x2,…,xN},xi表示语句中第i个词语,i=1,2,…,N,N表示语句中的词语数量; 对于每个语句的词语序列,采用BIOtag序列标注法标注出其中的触发词和事件论元,将触发词分别和每个事件论元组成关系对,然后将词语序列作为输入,触发词-事件论元关系对作为对应的事件标签,构成训练样本; S2:构建事件要素抽取模型,包括额外数据编码模块、要素分类器、语句重构模块、重构语句编码器、关系分类器和事件解码模块,其中: 额外数据编码模块用于在输入语句的词语序列S={x1,x2,…,xN}中融入预设的要素数据,得到融合矩阵F并发送给要素分类器,语句和要素数据融合的具体方法为: 对于需要进行事件抽取的语句,将其词语序列S={x1,x2,…,xN}中每个词语分别进行编码得到其隐层表示其中d表示预设的隐层表示的维度,将每个词语的隐层表示作为行向量构建得到语句的隐层表示矩阵 记金融事件中涉及的要素数量为M,将M个要素分别进行编码得到其隐层表示将每个要素的隐层表示作为行向量构建得到要素的隐层表示矩阵然后将隐层表示矩阵复制N份,构建得到三维的要素矩阵 采用如下公式将要素矩阵与语句的隐层表示矩阵进行融合,得到融合矩阵 F=E′DXT 其中,是可学习的参数矩阵,上标T表示转置; 要素分类器用于将融合矩阵F按照第3维进行分片,得到N个矩阵将矩阵fi作为输入语句中第i个词语的特征对i个词语进行分类,预测该词语是否为金融事件的要素,将词语分类结果发送给语句重构模块; 语句重构模块用于根据词语分类结果对语句进行重构,具体方法为:根据词语分类结果筛选出词语序列S={x1,x2,…,xN}中的金融事件要素,记所筛选出的要素数量为K,记第k个要素为pk,然后将K个要素两两组合,得到KK-1个要素对pk,pk′,k,k′=1,2,…,K且k′≠k;分别将每个要素对pk,pk′与词语序列S={x1,x2,…,xN}拼接,得到词语序列Sk,k′={pk,pk′,x1,x2,…,xN}并输出至重构语句编码器; 重构语句编码器用于分别对KK-1个词语序列Sk,k′进行编码,得到对应的隐层表示Rk,k′并发送至关系分类器; 关系分类器用于分别对KK-1个隐层表示Rk,k′进行分类,得到对应要素对pk,pk′是否为触发词-事件论元关系,并将分类结果发送至事件解码模块; 事件解码模块用于根据要素对的分类结果完成事件解码,具体方法为:从判定为是触发词-事件论元关系的要素对中,筛选出相同要素作为触发词,其他要素作为事件论元,构成金融事件并输出; S3:将步骤S1训练样本中的词语序列作为输入,对应的事件标签作为期望输出,对事件要素抽取模型进行训练; S4:当需要对某条语句进行金融事件抽取时,获取该语句的词语序列S′并输入至步骤S3训练好的事件要素抽取模型,预测得到该语句所包含的要素以及存在触发词-事件论元关系的要素对,从判定为存在触发词-事件论元关系的要素对中,筛选出出现频率最高的要素作为触发词、其他要素作为事件论元,构成金融事件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200000 上海市普陀区山中山北路3663号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励