首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于UIE模型的矛盾纠纷数据信息抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:数据空间研究院

摘要:本发明公开了一种基于UIE模型的矛盾纠纷数据信息抽取方法,S1、形成完整的矛盾纠纷数据集;S2、生成通用的词嵌入模型;S3、构建结构化的信息抽取语言,并将各类抽取任务的结构化表示统一转换为标准化编码格式;S4、通过结构化的信息抽取语言将非结构化文本信息转化为结构化的文本信息;S5、构建结构化模式指导器,输出结构化信息;S6、提取包含实体、关系、属性的三元组信息,并将提取出的信息通过结构化信息抽取语言进行统一表示;S7、利用三元组信息、矛盾纠纷数据集和词嵌入模型构建矛盾纠纷专题知识图谱。本发明显著提高了矛盾纠纷数据信息抽取的效率和准确性,能够适应多样化的任务需求,并具有较强的模型适应性和扩展性。

主权项:1.一种基于UIE模型的矛盾纠纷数据信息抽取方法,其特征在于,包括如下步骤:S1、获取矛盾纠纷相关的文本数据,对文本数据进行整合和清洗,去除重复、错误及不完整的数据,并对文本数据中的个人隐私信息进行脱敏处理,形成完整的矛盾纠纷数据集;S2、利用矛盾纠纷数据集中的部分数据,对UIE模型从开源语料中进行自监督式预训练,优化UIE模型对文本数据的编码能力,生成通用的词嵌入模型;S3、构建结构化的信息抽取语言,并将各类抽取任务的结构化表示统一转换为标准化编码格式;S4、对矛盾纠纷数据集中非结构化文本的关键信息进行定位,并利用词嵌入模型将所定位到的文本段进行关联组合,通过结构化的信息抽取语言将非结构化文本信息转化为结构化的文本信息;S5、构建结构化模式指导器,确立在矛盾纠纷数据集的信息抽取过程中需要识别的元素,包括名词性信息和与之建立联系的名称,通过将结构化的信息抽取语言与结构化模式指导器的提示词语、矛盾纠纷数据集中的文本信息及生成的词嵌入模型结合,并输入到UIE模型的编码器中,生成隐层表示,并通过自动回归方法将输入文本解码为线性的SEL格式,输出结构化信息;S6、根据矛盾纠纷任务构建提示词语信息,并带入UIE模型中,利用矛盾纠纷数据集对参数调优后的UIE模型进行训练,提取包含实体、关系、属性的三元组信息,并将提取出的信息通过结构化信息抽取语言进行统一表示;S7、利用三元组信息、矛盾纠纷数据集和词嵌入模型构建矛盾纠纷专题知识图谱。

全文数据:

权利要求:

百度查询: 数据空间研究院 一种基于UIE模型的矛盾纠纷数据信息抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。