首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种文档翻译中智能还原原文样式的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海一者信息科技有限公司

摘要:一种文档翻译中智能还原原文样式的方法,包括如下步骤:S100、解析文件获得原文,将原文翻译为译文;获取原文的特殊样式,以及译文中的修订痕迹、特殊样式,并在修订痕迹、特殊样式处使用替代字符进行替换,然后以修订痕迹、特殊样式处的字符下标值为key,字符值及样式为value存入map中;S200、识别句子并按格式分块,将原文句子按照存在样式的部分进行分割,得到原文集合,将对应的译文句子按照原文集合分割为译文集合;S300、将原文集合和译文集合发送到词对齐模块进行词对齐,使得原文的词和译文的词相对应;S400、根据词对齐结果还原样式,获得具有和原文相同样式的译文。本发明可以快速完成译文样式回填,在译文中还原原文格式,可显著提高翻译生产力。

主权项:1.一种文档翻译中智能还原原文样式的方法,其特征在于,包括如下步骤:S100、解析文件获得原文,将原文翻译为译文;获取原文的特殊样式,以及译文中的修订痕迹、特殊样式,并在修订痕迹、特殊样式处使用替代字符进行替换,然后以修订痕迹、特殊样式处的字符下标值为key,字符值及样式为value存入map中;S200、识别句子并按格式分块,将原文句子按照存在样式的部分进行分割,得到原文集合;S300、将原文集合和译文集合发送到词对齐模块进行词对齐,使得原文的词和译文的词相对应;S400、根据词对齐结果还原样式,获得具有和原文相同样式的译文;具体包括:S410处理对齐结果:S411、替换轮询译文集合,针对译文集合中的元素文本进行再次进行轮询,同时在记录递增的下标值;如果当前处于轮询中的文本字符和记录的下标值对应原先译文的字符不一致时,则获取原先译文下标值对应字符填充至备用文本池中,同时下标值递增继续进行比较;如果一致则将轮询中的文本字符放入备用文本池中,并循环至下一个文本字符;如果识别到当前元素为替代字符,那么根据当前下标值去样式map中寻找改字符,并将改字符放入备用文本池中;在当前元素文本中的所有字符轮询完毕后,将备用文本池中的内容去替换当前元素文本,循环至下一个元素文本;S412、应用原文样式到译文获取原文中特殊样式字符对齐的结果位置,将译文集合中与结果位置对应处的元素清空,并补充原文TAG样式后重新放入同一个元素内;S420、还原样式还原译文原先样式为Atom集合,再次遍历译文集合,现在集合中会存在两种类型的元素,一种是普通文本元素,另一种是已经替换过的Atom子集合;在还原创建时,依旧检查文本字符的下标值在样式map中是否存在对应的特殊样式,如果是添加或者删除样式,那么需要将Atom的reviseType设置成1或者-1;如果是其他样式那么在创建好首尾样式Atom后将改文本Atom放置中间,最后将3个Atom放入集合,还原结果,对齐完毕。

全文数据:

权利要求:

百度查询: 上海一者信息科技有限公司 一种文档翻译中智能还原原文样式的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。