买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及一种双通道循环胶囊神经网络的生物医学词义消歧方法。首先对生物医学语料进行处理,对包含歧义词汇的生物医学句子进行词性标注和语义类标注处理,得到处理好的训练数据和测试数据。然后,利用训练数据对网络进行优化,得到优化后的双通道循环胶囊神经网络。利用优化后的双通道循环胶囊神经网络对测试数据进行消歧,得到歧义词汇在每个语义类别下的概率分布序列,将具有最大概率的语义类别作为歧义词汇的语义类别。本发明对歧义词汇实现了很好的消歧,能够更准确地判断歧义词汇的真实含义。
主权项:1.双通道循环胶囊神经网络的生物医学词义消歧,该方法包含以下步骤:步骤1:对生物医学语料中的所有句子进行词性标注和语义类标注;步骤2:设置词窗大小和歧义词,把词窗从左向右移动,计算词窗移动过程中将出现歧义词的词窗内的其它词汇的词频总值,选取词频总值最高的词汇并将它们的词性和语义类作为消歧特征;步骤3:将处理好的生物医学语料按照7:3的比例划分为训练数据和测试数据,利用Bert模型对训练数据和测试数据进行向量化处理;步骤4:训练包括前向传播和反向传播两个过程,利用训练数据来优化双通道循环胶囊神经网络;步骤5:测试过程为前向传播过程,即语义分类过程,将测试数据输入到优化后的双通道循环胶囊神经网络中,计算歧义词汇在每个语义类别下的概率分布序列,将具有最大概率的语义类别作为歧义词汇的语义类别。
全文数据:
权利要求:
百度查询: 哈尔滨理工大学 双通道循环胶囊神经网络的生物医学词义消歧
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。