基于信息多步融合和边界对齐的古汉语实体关系抽取方法

导航：龙图腾网> 最新专利技术> 基于信息多步融合和边界对齐的古汉语实体关系抽取方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了基于信息多步融合和边界对齐的古汉语实体关系抽取方法，该方法通过多步融合关系语义信息和实体边界对齐完成古汉语实体关系抽取；通过多步融合关系语义信息丰富文本中的关系特征，缓解了古汉语实体关系抽取中关系抽取召回率较低问题，同时，将实体关系抽取任务建模为实体抽取和初始三元组抽取两个子任务并利用实体边界对齐验证，提升了复杂文本场景下实体边界识别和实体关系三元组抽取的准确率，降低了信息抽取的冗余度；本发明采用联合抽取实体及其关系的方式，避免了实体识别到关系抽取过程中存在的误差传播问题。

主权项：1.基于信息多步融合和边界对齐的古汉语实体关系抽取方法，其特征在于，包括如下步骤：步骤S1：构建古汉语实体关系数据集，古汉语实体关系数据集包括若干条古汉语文本；步骤S2：对古汉语实体关系数据集进行定义，设定包含条古汉语文本的古汉语实体关系数据集为，为中第条古汉语文本；古汉语文本为，为中的第个字；预定义的关系集合为，包含个关系类别，为中第类关系；从古汉语文本中抽取实体和关系并通过三元组的格式输出，实体包括主实体和客实体，三元组表示为，表示中主实体的跨度，表示Y中客实体的跨度，表示中主实体和客实体之间的关系；步骤S3：构建古汉语实体关系抽取模型，所述古汉语实体关系抽取模型由特征编码器、融合器、实体抽取器、实体关系三元组抽取器、实体边界对齐模块组成；特征编码器包括文本特征编码器和关系特征编码器；融合器由相互交互的文本关系信息融合器和关系文本信息融合器组成，文本关系信息融合器和关系文本信息融合器均由信息交互模块、残差模块、信息拼接模块组成；实体抽取器包括实体边界链接标签预测模块、标签解码模块；实体关系三元组抽取器包括实体关系链接标签预测模块、标签解码模块；步骤S4：将古汉语文本和由关系进行拼接构成的关系句子分别作为文本特征编码器和关系特征编码器的输入，得到古汉语文本的字嵌入特征向量和关系句子的字嵌入特征向量；文本特征编码器和关系特征编码器均由预训练好的BERT模型构成；步骤S5：将古汉语文本的字嵌入特征向量作为主体信息，关系句子的字嵌入特征向量作为辅助信息输入文本关系信息融合器中，得到文本特征表示；将关系句子的字嵌入特征向量作为主体信息，古汉语文本的字嵌入特征向量作为辅助信息输入关系文本信息融合器中，得到关系特征表示；步骤S6：将文本特征表示中的不同字嵌入特征向量进行拼接，得到文本特征拼接表示，将文本特征表示和关系特征表示进行拼接，得到关系特征拼接表示；步骤S7：将文本特征拼接表示输入实体抽取器中，得到预测实体边界链接标签，并基于预测实体边界链接标签对文本特征拼接表示进行解码得到实体头词和尾词的位置，对实体头词和尾词进行拼接，构成古汉语实体集合，再通过交叉熵损失函数计算实体边界损失，优化更新特征编码器和实体抽取器的模型参数；步骤S8：将关系特征拼接表示输入实体关系三元组抽取器，得到初始三元组，再通过交叉熵损失函数计算初始三元组损失,优化更新特征编码器和实体关系三元组抽取器的模型参数；步骤S9：将预测实体边界链接标签和初始三元组输入实体边界对齐模块中，基于古汉语实体集合对预测实体边界链接标签和初始三元组进行对齐，选出最终实体关系三元组。

全文数据：

权利要求：

百度查询：江西师范大学基于信息多步融合和边界对齐的古汉语实体关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：显示面板及显示装置

下一篇：一种用于锂电池EIS检测的单电感多输入单输出DC-DC系统及其控制方法

相关技术

显示面板及显示装置

一种用于锂电池EIS检测的单电感多输入单输出DC-DC系统及其控制方法

一种制备甲基丙烯酸甲酯的后处理方法及后处理装置

一种短纤维硬质保温复合材料的高效制备工艺

业务请求的业务分表查询方法、装置、设备及存储介质

一种智慧睡眠监控装置及系统

基于ODDM调制的MIMO系统信道估计方法和装置

一种水利水电施工工程用供料装置

一种热减粘的PET保护膜

一种可自清洗的PVC电缆料螺旋上料机

具有抗腐蚀钝化膜的Fe-Cr-Si合金及制备方法

一种电缆插接套管打磨修复装置

古汉语相关技术

一种汉语言文学资料库在线查询阅读方法及系统_渭南职业技术学院_202411279992.6

汉语汉字表达式规则制定方法、将汉字编制为表达的方法及装置_杨明伟_202310653981.9

一种古汉字展示基架_辽宁师范大学_202422668734.9

一种古汉字放大教学演示装置_辽宁师范大学_202422659389.2

一种采用声学单位的汉语方言口音矫正方法和系统_浙江大学_202411013205.3

一种基于深度神经网络的汉语电子喉语音转换装置及方法_昆山杜克大学_202210180441.9

基于深度学习的汉语-壮语双向机器翻译系统及构建方法_广西民族大学_202411046374.7

一种辅助翻页的汉语言文学教材固定装置_新疆天山职业技术大学_202420512147.8

一种针对汉语语素的训练系统、方法、电子设备和存储介质_北京喜阅童乐教育科技有限公司_202411074229.X

确定汉语文本合成语音时韵律结构的方法及计算机可读存储介质_清华大学深圳国际研究生院_202111525128.6

实体相关技术

增强现实体验功率使用预测_斯纳普公司_202380036550.6

基于卷积特征共享的实体关系联合抽取方法及系统_齐鲁工业大学(山东省科学院)_202411152567.0

基于大小模型协作的数据增强实体关系三元组抽取方法_国网山东省电力公司德州供电公司_202411192540.4

一种基于实体对与最短依赖路径的关系抽取方法及装置_苏州大学_202411304023.1

一种可编程实体迷宫单总线控制系统_福建拓疆机器人有限公司_202411565278.3

虚拟环境中的实体确定方法、装置、设备及介质_腾讯科技(深圳)有限公司_202411096365.9

一种多层次网络空间实体距离度量方法_中国人民解放军网络空间部队信息工程大学_202111436491.0

基于信息多步融合和边界对齐的古汉语实体关系抽取方法_江西师范大学_202411595282.4

具有侧面实体纹理三维码标签、防伪系统以及防伪方法_熊建民_202110362566.9

一种用于工业机器人的数字孪生数字实体建模方法_中国矿业大学_202411350590.0

齐的相关技术

一种齐墩果酸类化合物及其制备方法和应用_延边大学_202411249333.8

一种齐拉西酮合成用中间体5-氯乙基-6-氯吲哚-2-酮的检测方法_江西开元生物医药科技有限公司_202411192069.9

对路线的走向的传输_均联智行有限公司_202010891914.7

增加LIDAR系统的像素的信噪比_应诺维思科技有限公司_202380036946.0

决定要引入光刻掩模的基板的一个或多个像素的效应的方法和设备_卡尔蔡司SMS有限公司_201880095686.3

调节容器处理机的传送带的速度的方法以及实施所述方法的装置_克朗斯股份公司_202410667812.5

用于检测由复合材料制成的结构元件中的缺陷的装置_额普西隆复合材料公司_202380036420.2

显示与出现于视频中的位置相关的多媒体内容的方法_冠捷投资有限公司_202310860602.3

具有减小的金属板硬度的用于皇冠盖的密封衬垫_阿克泰加DS有限公司_202380035628.2

用于电网支持的构网运行中的光伏系统的控制设计_西门子公司_202280095934.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于信息多步融合和边界对齐的古汉语实体关系抽取方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务