买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:电子科技大学成都学院
申请日:2024-12-23
公开(公告)日:2025-01-24
公开(公告)号:CN119358570A
专利技术分类:..使用机器翻译,例如用于多语言检索,用于客户端设备的服务器端翻译或实时翻译。[2020.01]
专利摘要:本发明涉及自然语言处理技领域。提供了一种基于深度学习对中医药多源数据翻译的方法,包括步骤:获取中医药相关数据,得到中医药初始数据集;对中医药初始数据集格式化处理,得到格式化数据集;对格式化数据集术语标注和文化背景标注,得到标注数据集;对标注数据集数据清洗,得到预处理数据集;对预处理数据集进行数据增强;构建初始翻译模型,对初始翻译模型训练,得到预训练翻译模型;对预训练翻译模型验证,根据验证结果对预训练翻译模型微调,对微调后的预训练翻译模型测试,并对测试结果评估;根据评估结果,对微调后的预训练翻译模型优化,得到翻译优化模型。解决了现有的机器翻译工具翻译结果不够精准,且文化适应性差的问题。
专利权项:1.一种基于深度学习对中医药多源数据翻译的方法,其特征在于,包括步骤:通过若干种数据源,获取中医药相关数据,得到中医药初始数据集;对中医药初始数据集进行格式化处理,得到格式化数据集;对格式化数据集进行术语标注和文化背景标注,得到标注数据集;对标注数据集进行数据清洗,根据数据来源、类型和语义特性建立数据集索引,根据数据集索引对清洗后的标注数据集进行存储,得到预处理数据集;对预处理数据集进行数据增强,并将增强后的预处理数据集动态划分为训练集、验证集和测试集;基于深度学习,构建初始翻译模型,通过训练集对初始翻译模型进行训练,得到预训练翻译模型;通过验证集对预训练翻译模型进行验证,根据验证结果对预训练翻译模型进行微调,通过测试集对微调后的预训练翻译模型进行测试,并对测试结果进行评估;根据评估结果,对微调后的预训练翻译模型进行优化,得到翻译优化模型。
百度查询: 电子科技大学成都学院 一种基于深度学习对中医药多源数据翻译的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。