一种基于大模型的掩码增强命名实体识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：江南大学;大连理工大学;吉林大学;苏州大学

摘要：本发明涉及自然语言处理技术领域，提供了一种基于大模型的掩码增强命名实体识别方法，该方法包括：采集待识别文本数据；预处理得到输入序列，输入训练好的识别模型得到识别结果；识别模型训练过程包括：基于设定掩码策略对训练输入序列进行掩码处理得到掩码输入序列，送入BERT模型得到实体、掩码上下文表示特征；执行命名实体识别任务和预测掩码任务且共享参数，得到实体预测值和掩码预测值；基于实体上下文表示特征和实体预测值计算第一损失函数，基于掩码预测值计算第二损失函数；更新模型参数；评估模型性能，重复训练直至性能达到设定要求。本发明能够充分理解语义，泛化能力较强，语境依赖性捕捉能力较强，误识别和漏识别情况较少。

主权项：1.一种基于大模型的掩码增强命名实体识别方法，其特征在于，包括：步骤S1：采集待识别文本数据；步骤S2：对所述待识别文本数据进行预处理，得到输入序列；步骤S3：将所述输入序列输入训练好的识别模型，得到识别结果；其中，所述识别模型的训练过程包括：采集训练文本数据；对所述训练文本数据进行预处理，得到训练输入序列；基于设定的掩码策略对所述训练输入序列进行掩码处理，得到掩码输入序列；将所述训练输入序列和所述掩码输入序列送入BERT模型，得到实体上下文表示特征和掩码上下文表示特征；执行命名实体识别任务和预测掩码任务且共享参数；在所述命名实体识别任务中，采用NER-Classifier对所述实体上下文表示特征进行识别和分类得到实体预测值；在所述预测掩码任务中，采用MLM-Classifier对所述掩码上下文表示特征进行token预测得到掩码预测值；基于所述实体上下文表示特征和所述实体预测值计算第一损失函数，基于所述掩码预测值计算第二损失函数；在每个训练周期内基于所述第一损失函数和所述第二损失函数进行梯度计算以更新所述识别模型的参数；在每个训练周期结束时基于所述实体预测值和所述掩码预测值进行性能评估；重复训练直至所述识别模型的性能达到设定要求。

全文数据：

权利要求：

百度查询：江南大学大连理工大学吉林大学苏州大学一种基于大模型的掩码增强命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于大健康行业服务商的数字化评估系统

下一篇：一种端子压接装置

相关技术

基于大健康行业服务商的数字化评估系统

一种端子压接装置

一种鱼钩扣焊接剂涂抹机

一种焊剂生产环保炉盖

一种基于车桥耦合系统的桥梁检测装置

图像编码/解码方法和装置，以及发送比特流的方法

一种基于三波段光谱的壁画地仗磷酸盐含量检测方法

一种涤纶长丝生产自动缠绕打结装置

一种带清洗功能的双轴卧式搅拌机

增压器转速控制方法、装置、设备及存储介质

一种基于GCV正则化的BDS-3多频周跳探测与修复方法及系统

一种护发素灌装用瓶体定位装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大模型的掩码增强命名实体识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务