一种基于度量学习的小样本命名实体识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：贵州师范大学

摘要：本申请的实施例提供一种基于度量学习的小样本命名实体识别方法。应用于人工智能技术领域，包括：获取语料数据分为训练集和测试集，根据训练集构建实体类型到实体的映射；将训练集划分为支持集和查询集，并分别构建实体引导掩码提示，得到支持集句子输入增强序列和查询集句子输入增强序列，并采用预训练语言模型进行编码处理，得到支持集token编码和查询集token编码；计算两种编码的相似度，并构造相似度矩阵得到相似度分数，根据相似度分数计算损失函数，得到训练后的预训练语言模型；将测试集划分为支持集和查询集，输入到预训练语言模型中进行处理，进行实体类型预测。以此方式，本申请能够有效提升在小样本条件下文本分类的准确性及可靠性。

主权项：1.一种基于度量学习的小样本命名实体识别方法，其特征在于，包括以下步骤：获取语料数据，构建语料数据训练集和测试集，根据所述训练集构建实体类型到实体的映射；将所述训练集划分为训练支持集和训练查询集，基于所述映射分别在所述训练支持集和所述训练查询集上构建实体引导掩码提示，得到训练支持集增强序列和训练查询集增强序列；其中，所述基于所述映射分别在所述训练支持集和所述训练查询集上构建实体引导掩码提示，得到训练支持集增强序列和训练查询集增强序列的过程为：所述训练支持集数据分别构建实体类型整合提示和类型实例指导提示，得到训练支持集实体类型整合提示增强序列和训练支持集类型实例指导提示增强序列，进而得到训练支持集增强序列；对所述训练查询集构建类型实例指导提示，得到训练查询集增强序列；其中，所述实体类型整合提示的构建过程为：获取所述训练支持集中的单词序列以及对应的标签序列，遍历所述标签序列得到非‘O’实体类型数据：所述非‘O’实体类型数据对应的单词标记为实体，并记录所述实体对应的实体类型，根据所述实体及所述实体类型构建得到末端提示字符串，将所述末端提示字符串拼接到所述单词序列的末端，得到初步增强序列；基于所述映射得到与所述实体类型相关频率最高的实体作为映射实体，根据所述实体类型及所述映射实体构建得到前端提示字符串，将所述前端提示字符串拼接到所述初步增强序列的前端，完成实体类型整合提示；其中，所述类型实例指导提示的构建过程为：识别所述映射中的全部实体类型以及对应最常关联的实体，并进行配对，形成提示前缀，将所述提示前缀拼接到单词序列的前端，完成类型实例指导提示；采用预训练语言模型对构建有实体引导掩码提示的所述训练支持集增强序列及所述训练查询集增强序列进行编码处理，得到训练支持集token编码和训练查询集token编码；其中，所述训练支持集token编码和所述训练查询集token编码的获取过程为：将所述训练支持集实体类型整合提示增强序列及所述训练支持集类型实例指导提示增强序列输入到所述模型中进行处理，得到训练支持集输出结果，采用掩码向量对所述训练支持集输出结果进行编码并进行加权处理得到训练支持集token编码；将所述训练查询集增强序列输入到所述模型中进行处理，得到训练查询集输出结果，采用掩码向量对所述训练查询集输出结果进行编码，得到训练查询集token编码；计算所述训练支持集token编码及所述训练查询集token编码的相似度，并构造相似度矩阵进行相似度分析，得到相似度分数，根据相似度分数计算损失函数，得到训练后的所述预训练语言模型；将所述测试集划分为测试支持集和测试查询集，将所述测试支持集和所述测试查询集数据输入到训练后的所述预训练语言模型中进行处理，进行实体类型预测。

全文数据：

权利要求：

百度查询：贵州师范大学一种基于度量学习的小样本命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：半导体器件及其制备方法

下一篇：一种胶原蛋白肽饮品及生产工艺

相关技术

半导体器件及其制备方法

一种胶原蛋白肽饮品及生产工艺

管体、内窥镜及装配方法、约束结构的成型方法、治具

一种生物基材料干燥装置

一种防爆型两位三通空气电磁阀

一种塑料粒子均匀进料加工装置

一种常山酮乳酸盐对映异构体的检测方法

一种用于前列腺癌治疗的lncRNA ENST00000510619及其应用

一种基于物联网的污染管控系统

热源塔热泵耦合燃气吸收式热泵的供热装置

一种履腿平衡式移动机器人及方法

一种基于坐标变换的海面目标双站被动定位方法

样本相关技术

一种尿液样本采集套装_深圳市人民医院_202323065544.X

一种样本自动采集系统_成都棱镜泰克生物科技有限公司_202411060917.0

样本检验的方法及其系统_应用材料以色列公司_201911402710.6

生物样本灌流工艺及灌流系统_季华低温生物科技(广东)有限公司_202410735830.2

一种土壤样本采样装置_承德市御道口牧场管理区农牧技术推广中心_202323000973.9

免疫设备样本针空吸故障识别方法_安图实验仪器(郑州)有限公司_202311562936.9

一种水质检测样本采集架_江苏沥环科技有限公司_202323509218.3

一种用于混凝土样本注塑的模具_深圳大学_202323321679.8

一种病媒生物实验用样本研磨装置_梁慧杰_202420286586.1

一种微生物样本采集储存装置_西安百惠生物科技有限公司_202323087809.6

实体相关技术

融合实体多维特征的基于无监督学习的实体对齐方法_南京航空航天大学_202411003493.4

地理实体数据生成方法及系统_广州蓝图地理信息技术有限公司_202411253944.X

实体碳化硅空心顶针制备方法_东莞市志橙半导体材料有限公司_202410968138.4

估计移动设备的定位的方法和实体_高通股份有限公司_202410750442.1

通过预训练BERT进行化学生产命名实体识别的方法_中国石油大学(华东)_202411251998.2

一种基于多视图蒸馏增强的实体链接方法_中国科学院信息工程研究所_202410736212.X

一种无线网络实体的信任评估方法_东南大学_202410934649.4

知识图谱的实体对齐方法、装置、计算机设备和存储介质_腾讯科技(深圳)有限公司_202011314360.0

一种命名实体识别方法、装置、电子设备及存储介质_北京环境特性研究所_202210007201.9

在包括基站的通信网络中的方法和通信网络中的网络实体_摩托罗拉移动有限责任公司_202110917602.3

命名相关技术

通过预训练BERT进行化学生产命名实体识别的方法_中国石油大学(华东)_202411251998.2

一种牙齿排序与批量命名方法、装置、电子设备及介质_南昌大学附属口腔医院(江西省口腔医院)_202410892477.9

一种命名实体识别方法、装置、电子设备及存储介质_北京环境特性研究所_202210007201.9

一种基于知识图谱的命名实体自动识别方法_中国舰船研究设计中心_202410864368.6

一种基于度量学习的小样本命名实体识别方法_贵州师范大学_202410977148.4

基于迁移学习的基地命名实体识别系统及方法_中国人民解放军海军工程大学_202111652819.2

一种融合汉字特征和词对关系的命名实体识别方法_安徽师范大学_202410878469.9

文件命名方法、装置、终端设备以及存储介质_深圳模德宝科技有限公司_202410411572.2

命名实体识别方法、装置、电子设备及计算机存储介质_阿里巴巴集团控股有限公司_201911425813.4

文本命名实体识别及模型训练方法及装置、存储介质_马上消费金融股份有限公司_202310310779.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于度量学习的小样本命名实体识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务