买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:兰州大学
摘要:本发明公开了一种基于两部分Loss的汉盲自动转换方法及系统,包括:构建汉盲平行语料库,对汉盲平行语料库进行处理,获得不带分词的盲点序列、盲点对应的盲文分词标记序列与汉语序列,均进行编码;构建机器翻译模型,基于编码后的数据对机器翻译模型进行训练,获得基于两部分Loss的机器翻译模型;将待转换汉语句子输入模型中,获得预测盲点序列与分词标记,基于分词标记与预测盲点序列获得最终盲文序列,完成汉盲自动转换。本发明进行端到端汉盲翻译的同时考虑到使用两个Loss分别优化盲点生成以及盲文分词两个任务,在翻译过程中的每个时间步预测盲点及分词标记,从而得到最终的盲文序列,准确率得到了提高。
主权项:1.一种基于两部分Loss的汉盲自动转换方法,其特征在于,包括以下步骤:构建汉盲平行语料库,对所述汉盲平行语料库进行处理,获得汉语序列、不带分词的盲点序列以及盲点对应的盲文分词标记序列;对所述汉语序列、所述不带分词的盲点序列、所述盲文分词标记序列进行编码;构建端到端的机器翻译模型,基于编码后的数据对所述机器翻译模型进行训练,获得基于两部分Loss的机器翻译模型;将待转换汉语句子输入基于两部分Loss的机器翻译模型,获得预测盲点序列与分词标记,基于所述分词标记在预测盲点序列中插入空格,获得最终盲文序列,完成汉盲自动转换。
全文数据:
权利要求:
百度查询: 兰州大学 一种基于两部分Loss的汉盲自动转换方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。