基于BERT-DPCNN-BiLSTM的生物医学词义消歧

导航：龙图腾网> 最新专利技术> 基于BERT-DPCNN-BiLSTM的生物医学词义消歧

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨理工大学

摘要：本发明涉及一种基于BERT‑DPCNN‑LSTM的生物医学词义消歧方法。现有的生物医学文本中存在着词义模糊问题，给信息提取和文本理解带来了很大的困难。为了解决这一问题，本发明提出了一种结合BERTBidirectionalEncoderRepresentationsfromTransformers、DPCNNDeepPyramidConvolutionalNeuralNetwork和BiLSTMBidirectionalLongShort‑TermMemory的词义消歧模型，旨在对生物医学文本中的词义进行准确消歧。本发明首先利用BERT模型将生物医学文本转换为高维词向量，以捕捉词语的语义信息。然后，通过DPCNN模型，对文本进行卷积操作，在DPCNN中引入了HighwayNetwork作为非线性激活层来解决梯度消失问题。接着，利用BiLSTM模型对特征进行时序建模，以捕捉文本序列中的上下文信息。同时，引入多头注意力机制，增强特征提取过程中的语义关联。最后，通过全连接层对提取的特征进行分类，得到生物医学歧义词属于不同类别的概率分布。本发明的优点在于能够有效地消除生物医学文本中的词汇歧义，在生物医学词义消歧领域取得了显著的性能提升。

主权项：1.基于BERT-DPCNN-BiLSTM的生物医学词义消歧方法，该方法包括以下步骤：步骤1：首先去除生物医学语料句子中的停用词，再对这些词汇进行词性和语义类标注处理，选取句子中与歧义词汇w语义关联度最大的左右6个词汇单元的词形、词性和语义类作为消歧特征。步骤2：选取一小部分处理好的语料作为测试语料，其余的作为训练语料，利用BERT模型对提取的消歧特征进行向量化处理，转换为词向量，得到训练数据集和测试数据集。步骤3：训练阶段，利用训练数据集对DPCNN-BiLSTM模型进行优化，得到优化后的DPCNN-BiLSTM模型。步骤4：测试阶段，即语义分类过程，将测试数据集输入到优化后的DPCNN-BiLSTM模型，计算歧义词w在不同语义类别下的概率分布，其中具有最大概率的语义类别即为歧义词的语义类别。

全文数据：

权利要求：

百度查询：哈尔滨理工大学基于BERT-DPCNN-BiLSTM的生物医学词义消歧

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

下一篇：投屏声音故障的确定方法、装置、电子设备和存储介质

相关技术

一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

投屏声音故障的确定方法、装置、电子设备和存储介质

设备健康预测方法和计算机可读存储介质

云计算架构多租户任务资源分配调度方法及装置

信息展示方法及电子设备

具有均匀氢键合相互作用、同碱基对和异碱基对偏好以及错配辨别力的修饰核碱基

一种无施工平台的远岸成品钢管桩的测量方法

具有悬臂式叶轮的血液泵

具备适应不同体型患者的呼吸内科胸腔穿刺辅助装置

一种纤维假捻纺纱设备及用于复合纤维的纺纱工艺

基于比例时滞惯性模糊CG神经网络的保密通信方法

一种煤矿井下风水管路在线监测系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于BERT-DPCNN-BiLSTM的生物医学词义消歧

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务