首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度学习的文字翻译方法、系统、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津市天益达科技发展有限公司;海南即客科技有限公司

摘要:本发明公开了基于深度学习的文字翻译方法、系统、设备及存储介质,涉及语言处理技术领域,包括:获取网络热门词并对多语言翻译数据进行记录;建立卷积神经网络,对翻译特征进行提取,建立翻译确定方法;基于卷积神经网络对文字进行翻译;本发明用于解决现有技术中对文字翻译的改进方法仅能将文章内容以及用户信息进行结合,而当用户采用相同的书写格式且书写内容为当下较为流行的网络用语时,仅通过文章内容以及用户信息仍会在对网络用语进行翻译时采用原有的翻译方法,导致翻译后的文章与原本的语义存在差异的问题。

主权项:1.基于深度学习的文字翻译方法,其特征在于,包括:基于大数据实时获取网络热门词并对网络热门词的多语言翻译数据进行记录,并对记录的语言翻译数据进行更新;基于网络热门词建立卷积神经网络,并在卷积神经网络中基于多语言翻译数据对翻译特征进行提取,基于翻译特征的提取结果建立翻译确定方法;基于卷积神经网络对文字进行翻译;基于大数据实时获取网络热门词并对网络热门词的多语言翻译数据进行记录,并对记录的语言翻译数据进行更新包括:基于大数据实时获取网络中的多个网络热门词,并将多个网络热门词放入数组α中;对于数组α中的任意一个网络热门词α1,建立平面直角坐标系,记为指数分析坐标系,其中,指数分析坐标系的横坐标的单位为时间,纵坐标的单位为指数值;将网络热门词α1在网络指数中的搜索指数以及资讯指数对应的曲线放置在指数分析坐标系,并分别记为搜索指数曲线以及资讯指数曲线;将搜索指数曲线中纵坐标最大的点记为搜索峰点(K1,K2),将资讯指数曲线中纵坐标最大的点记为资讯峰点(L1,L2);基于大数据实时获取网络热门词并对网络热门词的多语言翻译数据进行记录,并对记录的语言翻译数据进行更新还包括:将搜索指数曲线中纵坐标为K22的点记为搜索中点;将资讯指数曲线中纵坐标为L22的点记为资讯中点;将搜索指数曲线中横坐标距离K1最近且横坐标大于K1的搜索中点记为搜索参考中点,将搜索参考中点的横坐标与K1的差的绝对值记为搜索降半时间;将资讯指数曲线中横坐标距离L1最近且横坐标大于L1的资讯中点记为资讯参考中点,将资讯参考中点的横坐标与L1的差的绝对值记为资讯降半时间;将搜索降半时间以及资讯降半时间的平均值记为网络热门词α1的热门参考时间,其中,当未能在搜索指数曲线或资讯指数曲线中获取到搜索参考中点或资讯参考中点时,将网络热门词α1记为热度词;获取数组α中的所有网络热门词的热门参考时间,将所有热门参考时间的平均值记为标准热门时间;对于数组α中除热度词以外的任意一个网络热门词α1,当网络热门词α1的搜索峰点的横坐标距今的时间大于标准热门时间或网络热门词α1的资讯峰点的横坐标距今的时间大于标准热门时间时,将网络热门词α1从数组α中剔除;当网络热门词α1未被剔除时,将网络热门词α1记为热度词;基于大数据实时获取网络热门词并对网络热门词的多语言翻译数据进行记录,并对记录的语言翻译数据进行更新还包括:对于数组α中的任意一个热度词,基于网络爬虫获取热度词在国外网站中翻译后被使用次数最多的外文,记为热度词的多语言翻译数据,其中,当热度词被翻译为多种外文时,将每种外文中被使用次数最多的外文记录至热度词的多语言翻译数据中;获取所有热度词的多语言翻译数据;将网络指数的更新时间记为数据更新时间,在获取所有热度词的多语言翻译数据后,每隔数据更新时间重新获取所有热度词的多语言翻译数据。

全文数据:

权利要求:

百度查询: 天津市天益达科技发展有限公司 海南即客科技有限公司 基于深度学习的文字翻译方法、系统、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。