买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京搜狗科技发展有限公司
摘要:本发明实施例提供了一种字幕翻译方法、装置和用于字幕翻译的装置。所述方法包括:获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;对所述待翻译语句进行翻译处理,得到目标语句;对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应。本发明实施例可以保证翻译结果的准确性和流畅度,有利于提升翻译性能;并且,本发明实施例能够保证在呈现字幕行时,输出的目标语言字幕行文本与源语言字幕行文本对齐,有利于用户理解字幕行对应的音视频内容。
主权项:1.一种字幕翻译方法,其特征在于,所述方法包括:获取源语言字幕文件,所述源语言字幕文件包含至少两个源语言字幕行文本;对所述源语言字幕行文本进行合并处理,得到待翻译语句,所述待翻译语句包括完整的语义;对所述待翻译语句进行翻译处理,得到目标语句;对所述目标语句进行拆分处理,得到目标语言字幕行文本,所述目标语言字幕行文本与所述源语言字幕行文本一一对应;所述对所述目标语句进行拆分处理,得到目标语言字幕行文本,包括:基于预先训练的断句模型确定所述目标语句中的断点标识;根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本,其中,所述断点标识对应的分词是所述目标语言字幕行文本的左边界或右边界;所述根据所述断点标识,将所述目标语句切分成和所述源语言字幕行文本对齐的目标语言字幕行文本,包括:在所述断点标识对应的分词是所述目标语言字幕行文本的右边界的情况下,判断所述目标语句中是否存在与第一断点标识相对应的第二断点标识,所述第二断点标识位于所述第一断点标识之前;若所述目标语句中存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述第一断点标识与所述第二断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本;若所述目标语句中不存在与第一断点标识相对应的第二断点标识,则从所述目标语句中提取所述目标语句的第一个分词与所述第一断点标识之间的各个分词,并对提取的各个分词进行合并处理,得到目标语言字幕行文本。
全文数据:
权利要求:
百度查询: 北京搜狗科技发展有限公司 一种字幕翻译方法、装置和用于字幕翻译的装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。