一种面向智能问答系统的命名实体识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京邮电大学

摘要：一种面向智能问答系统的命名实体识别方法，包括如下步骤：为每条样本以滑动窗口的方式拼接上下文，并将普通的文本数据形式转化为机器阅读理解数据的形式；通过Bert预训练模型生成词向量特征；根据词向量特征，分别使用多尺度卷积与双向时序运算对其进行编码，得到样本的全局特征与局部特征；以等权重的方式为词向量特征拼接上全局特征与局部特征以增强词向量特征，得到上下文特征；对上下文特征采用多个线性网络识别文本中的命名实体。本发明能够充分利用问答系统中用户输入句子的上下文信息，以精准地抽取出用户问题中的命名实体；可以在命名实体识别的公开数据上都取得优异的效果，在对准确率要求较高的智能问答系统中具有良好的实用性。

主权项：1.一种面向智能问答系统的命名实体识别方法，其特征在于：包括如下步骤：S1：为每条目标样本以滑动窗口的方式拼接上下文，并将问答系统中的对话数据作为普通的文本数据形式，将其转化为机器阅读理解数据的形式，同时为每个样本拼接一个自然语言问题得到样本的初始向量s；S2：将向量s作为输入传给Bert预训练模型，得到词向量特征表示矩阵Ebert；S3：将矩阵Ebert分别通过正向时序运算和反向时序运算，并将两次运算的结果进行垂直拼接，得到局部特征表示矩阵ELocal；所述步骤S3中的正向时序运算是对矩阵Ebert＝[k1；k2；…；kn]的每一列向量按照从左到右的顺序依次进行如下计算： ct＝ft·ct-1+gt·it 其中，kt为矩阵Ebert第t列的列向量，在每次计算完成后将会得到记录信息的两个向量ct、这两个向量将参与下一次的运算，在每次计算中，都会得到四个中间向量it、ft、ot、gt，在计算中间向量时，Ei、Ef、Eo、Eg分别为生成中间向量时对输入向量kt的权重转移矩阵，Ui、Uf、Uo、Ug分别为生成中间向量时对前一次运算得到的向量ct-1的权重转移矩阵，bi、bf、bo、bg分别为计算中间向量时添加的偏置向量，σ、ta为激活函数，exp表示指数函数，·表示将参与运算向量中同一位置的元素进行相乘并得到一个同样维度的向量的运算，将每次计算所得到的依次排序，将得到正向时序运算的矩阵；所述步骤S3中的反向时序运算，需要将Ebert中的列向量按照[kn；kn-1；…；k1]的顺序反向排列，然后将反向排列过的矩阵中的列向量按从左到右的顺序依次进行运算获取到输出向量；S4：将矩阵Ebert分别通过卷积运算以及池化运算，得到向量l，并将l扩展成与ELocal同样的形状，得到全局特征表示矩阵Eglobal；将Ebert、Elocal、Eglobal以等权重的方式在水平方向上进行拼接得到上下文特征表示矩阵Econtext；S5：使用两个矩阵：开始线性变换矩阵Tstart、结束位置线性变化矩阵Tend，分别对Econtext进行线性变换，得到对应的开始位置预测概率矩阵Istart以及结束位置预测概率矩阵Iend；并对两个概率表示矩阵使用argmax函数，得到每个令牌是否可以作为开始索引或结束索引的结果S6：对于目标文本中的每个开始位置的令牌，将其特征表示与目标文本中的每一个结束位置的令牌的特征表示进行水平拼接得到向量mi；将所有的向量mi垂直拼接得到矩阵Ematch；使用线性变换矩阵Tmatch与Ematch相乘，再使用Sigmoid函数对结果进行归一化；将概率大于等于阈值的一组令牌作为从样本中的抽取出的某个实体开始与结束，该抽取的实体即为识别的结果。

全文数据：

权利要求：

百度查询：南京邮电大学一种面向智能问答系统的命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于实例分割网络的角膜移植缝合操作的AR导航方法及系统

下一篇：一种变截面大长径比复杂异形结构的磨粒流光整加工方法及夹具

相关技术

一种基于实例分割网络的角膜移植缝合操作的AR导航方法及系统

一种变截面大长径比复杂异形结构的磨粒流光整加工方法及夹具

一种智能型链条张紧装置

近红外线吸收玻璃及近红外线截止滤光片

一种微滴式数字PCR高浓度检测方法

显示装置

一种含梯级水电的电力市场出清方法、装置、设备及介质

同缆同路由的检测方法、装置、设备及计算机存储介质

一种基于改进蚁群算法的飞机低空突防航线规划方法

一种混凝土桥梁病害并行智能量化方法及装置

一种智能分布式热源装置

测定气氛烧结炉内气氛一致性的方法

命名相关技术

一种面向智能问答系统的命名实体识别方法_南京邮电大学_202111235560.1

电力计量的命名实体识别方法、装置和计算机设备_深圳供电局有限公司_202110837584.8

基于命名实体识别算法的检测报告分级比对系统及方法_中国电力科学研究院有限公司_202410856726.9

基于多层次自适应语义增强的中文医疗命名实体识别方法和装置_浙江工业大学_202410982954.0

一种基于原型网络的嵌套命名实体识别方法和装置_中国电子科技集团公司第十五研究所_202410776086.0

一种对抗式阅读理解嵌套命名实体识别方法_西南交通大学_202410606985.6

命名实体识别方法和装置、计算机可读存储介质及处理器_北京明朝万达科技股份有限公司_202011630033.6

命名实体识别方法、装置、存储介质及终端设备_平安科技(深圳)有限公司_202111233302.X

命名实体识别方法、装置、计算机设备及可读存储介质_平安科技(深圳)有限公司_202011123404.1

一种语句中命名实体的识别方法及装置_普天信息技术有限公司_201910354890.9

系统相关技术

电梯系统_通力股份公司_202280094062.6

破碎系统_博德凯石机械设备(营口)有限公司_202420206250.X

通报系统_本田技研工业株式会社_202310510030.6

制氧机系统_徐州市妇幼保健院_202410972700.0

监测系统_大安吉电绿氢能源有限公司_202411008488.2

制动系统_浙江零跑科技股份有限公司_202323591687.4

输送系统_上海微创心通医疗科技有限公司_202420306293.5

水路系统_佛山市芯耀环保科技有限公司_202411086153.2

测试系统_上海韬润半导体有限公司_202411396833.4

空调系统_中国联合网络通信集团有限公司_202211709874.5

问答相关技术

视觉问答方法、装置、设备、存储介质及产品_杭州海康威视数字技术股份有限公司_202411412767.5

一种面向智能问答系统的命名实体识别方法_南京邮电大学_202111235560.1

基于大语言模型检索增强生成的设施农业智能问答方法_浙江大学_202410950036.X

用户问答的处理方法、装置、存储介质及电子设备_杭州乒乓智能技术有限公司_202410840015.2

一种边检法律问答动态检索增强生成方法及系统_内蒙古工业大学_202410829490.X

基于混合专家大模型的医疗行业智能问答方法和系统_浪潮云信息技术股份公司_202411091691.0

一种基于知识蒸馏的呼吸暂停知识问答模型训练方法_北京小蝇科技有限责任公司_202411414096.6

一种基于医疗问答大模型的医疗数据收集方法_中科厚立信息技术(成都)有限公司_202411163486.0

基于预训练模型的智能问答方法、计算机设备与存储介质_时趣互动(北京)科技有限公司_202410763356.4

一种合同问答精准定位条款的方法_中国电建集团华东勘测设计研究院有限公司_202411039747.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种面向智能问答系统的命名实体识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务