首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本转换方法及相关装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安讯飞超脑信息科技有限公司

摘要:本申请公开了一种文本转换方法及相关装置,文本转换方法包括:获得待转换文本中的词,并设置非标点符号的词的标签;其中,标签包括词典中的多音词、词典中的非多音词或非词典中词;针对非标点符号的词,响应于词为词典中的非多音词,从词典中匹配获得词的音素序列和重音信息;响应于词为词典中的多音词和非词典中词,基于词构建对应的组合词,基于组合词和预测模型获得词的音素序列和重音信息;其中,当词为词典中的多音词时,组合词与词的上下文信息相关;当词为非词典中词时,组合词与词的上下文信息无关。通过上述方式,本申请能够利用统一的方式一并解决OOV词和多音词的问题。

主权项:1.一种文本转换方法,其特征在于,包括:获得待转换文本中的词,并设置非标点符号的词的标签;其中,所述标签包括词典中的多音词、词典中的非多音词或非词典中词;针对非标点符号的词,响应于所述词为词典中的非多音词,从所述词典中匹配获得所述词的音素序列和重音信息;响应于所述词为词典中的多音词和非词典中词,基于所述词构建对应的组合词,基于所述组合词和预测模型获得所述词的音素序列和重音信息;其中,当所述词为词典中的多音词时,所述组合词与所述词的上下文信息相关;当所述词为非词典中词时,所述组合词与所述词的上下文信息无关;其中,所述基于所述组合词和预测模型获得所述词的音素序列和重音信息的步骤,包括:获得所述组合词的第一矩阵表示;其中,所述组合词中的每个字符映射为所述第一矩阵表示中的一行元素;将所述第一矩阵表示输入至所述预测模型中,获得所述组合词的第二矩阵表示;其中,所述第二矩阵表示中的一行元素表示所述第一矩阵表示中对应行元素的字符为元音还是辅音,且当所述字符为元音时是否带重音;将所述第二矩阵表示通过字典映射的形式还原以获得所述词的音素序列和重音信息。

全文数据:

权利要求:

百度查询: 西安讯飞超脑信息科技有限公司 文本转换方法及相关装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。