买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于大语言模型检测和音素增强的越南语法纠错方法,属于自然语言处理技术领域。本发明首先使用多语言预训练模型mBART构建一个端到端的语法纠错基础模型,借助mBART强大的语言表征能力提升纠错效果;还设计了一个音素编码模块,旨在辅助纠错模型学习越南语的特有语言特性;进一步通过平均池化层提取包含越南语特征的音素信息,并确保其与文本信息表示在维度上的一致;随后,通过过滤门控机制将音素信息与文本信息融合,剔除音素信息中的干扰成分,以确保文本信息表示的准确性和可靠性;最后,在过滤门控机制之后添加一个错误检测层,通过精确识别错误,减少模型的过度校正现象,提升整体语法纠错的准确性和稳定性。
主权项:1.一种基于大语言模型检测和音素增强的越南语法纠错方法,其特征在于,所述方法的具体步骤如下:Step1、选取预训练模型mBART作为基础模型架构;Step2、收集越南语音素,构建越南语音素字典;Step3、在Step1的基础模型架构上,新增了一个音素编码模块,用于获取上下文音素信息表示;Step4、在音素编码模块后,引入了平均池化层和过滤性门控机制;Step5、通过在基础模型的编码端之后集成一个检测层,并对此层及模型的参数进行联合优化与调整,从而对整合了Step3和Step4的模型进行了全面训练和优化。
全文数据:
权利要求:
百度查询: 小语智能信息科技(云南)有限公司 一种基于大语言模型检测和音素增强的越南语法纠错方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。