首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

阿拉伯语元音恢复方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:科大讯飞股份有限公司

摘要:本申请公开了一种阿拉伯语元音恢复方法、装置、设备及存储介质,本申请利用无元音标注的阿语训练文本训练语言模型,可以基于大批量阿语训练文本训练得到对于阿语的单词有较好的泛化表示能力的语言模型,进而对于待处理阿语文本,利用语言模型确定待处理阿语文本中每一单词的特征表示,并获取待处理阿语文本中每一字符的文本特征,基于每一字符的文本特征,及每一字符所属单词的特征表示,确定待处理阿语文本中各字符对应的元音标注结果。本申请在对进行元音恢复时,同时参考了每一字符的文本特征及其所属单词的特征表示,也即参考信息更加丰富,同时借助于语言模型对阿语单词较好的泛化表示能力,可以提高各字符所预测的元音的准确度。

主权项:1.一种阿拉伯语元音恢复方法,其特征在于,包括:获取待处理阿语文本;利用预训练的语言模型确定所述待处理阿语文本中每一单词的特征表示,所述语言模型为基于无元音标注的阿语训练文本训练得到;获取所述待处理阿语文本中每一字符的文本特征;基于所述待处理阿语文本中每一字符的文本特征,以及每一字符所属单词的特征表示,确定所述待处理阿语文本中各字符对应的元音标注结果;其中,在所述基于所述待处理阿语文本中每一字符的文本特征,以及每一字符所属单词的特征表示,确定所述待处理阿语文本中各字符对应的元音标注结果的过程中将所述待处理阿语文本中,每一字符的文本特征与所述字符所属单词的特征表示进行融合,以基于融合后的特征确定所述待处理阿语文本中各字符对应的元音标注结果;获取所述待处理阿语文本中每一字符的文本特征,以及基于所述文本特征,以及每一字符所属单词的特征表示,确定所述待处理阿语文本中各字符对应的元音标注结果的过程,包括:利用预训练的元音恢复模型处理所述待处理阿语文本及其中每一单词的特征表示,以得到元音恢复模型输出的所述待处理阿语文本中各字符对应的元音标注结果;其中,所述元音恢复模型以带元音标注结果的阿语训练文本及所述阿语训练文本中每一单词的特征表示为训练数据,训练得到。

全文数据:

权利要求:

百度查询: 科大讯飞股份有限公司 阿拉伯语元音恢复方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。