基于上下文感知的自适应语音播报方法和系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：江苏华明国安技术有限公司

摘要：本发明公开了基于上下文感知的自适应语音播报方法和系统，包括：S1：使用有效字符合集对播报文本进行清洗，并对清洗后的播报文本进行分词；S2：基于共现矩阵和互信息提取分词结果中的上下文特征；S3：使用基于深度学习的端到端语音合成网络构建自适应语音播报网络，设定自适应语音播报网络的输入、输出和损失函数；S4：使用梯度下降方法更新自适应语音播报网络参数，获得训练完成的自适应语音播报网络；S5：使用训练完成的自适应语音播报网络与声码器对输入的新播报文本生成播报语音，并对生成的播报语音进行后处理。本发明能够利用上下文特征提取技术，使语音合成系统能够理解并适应各种文本内容和语境，生成更自然、流畅的语音播报。

主权项：1.基于上下文感知的自适应语音播报方法，其特征在于，包括以下步骤：S1：使用有效字符合集对播报文本进行清洗，并对清洗后的播报文本进行分词；S2：基于共现矩阵和点互信息提取分词结果中的上下文特征；S3：使用基于深度学习的端到端语音合成网络构建自适应语音播报网络，设定自适应语音播报网络的输入、输出和损失函数；S4：使用梯度下降方法更新自适应语音播报网络参数，获得训练完成的自适应语音播报网络；S5：使用训练完成的自适应语音播报网络与声码器对输入的新播报文本生成播报语音，并对生成的播报语音进行后处理；其中，所述步骤S1中，包括以下步骤：S11：清洗文本：定义包含有效字符的字符合集C，对播报文本T中的每个字符ti，若则移除，具体为：其中，T′为清洗后的播报文本；N表示T的长度；S12：分词：基于双向最大匹配方法对比清洗后的播报分本和词典从而进行分词，所述双向最大匹配方法分为正向最大匹配和逆向最大匹配；所述正向最大匹配从文本的开头开始，先从词典中匹配最长的词，不成功时逐渐减小匹配的长度，具体为：其中，Wfmm表示正向最大匹配分词结果；N′为清洗后的播报文本的长度；L为最大词长；T′[i′:i′+k]为清洗后的播报文本在索引i′至i′+k处的字符；i′为当前处理到的字符位置；为索引i′开始匹配到的词；所述逆向匹配从文本的末尾开始，从词典中匹配最长的词，同样在不成功时递减词的长度，具体为：其中，Wbmm表示逆向最大匹配分词结果；为索引i′开始向前匹配到的词；比较Wfmm和Wbmm的结果，选择分词数较少的结果以减少分词歧义，具体为：其中，|Wfmm|和|Wbmm|分别为正向最大匹配和逆向最大匹配分词结果中词的数量；Wfinal表示最终分词结果；其中，所述步骤S2中，包括以下步骤：S21：构建共现矩阵：使用共现矩阵来分析词与词之间的关系，所述共现矩阵记录每对词在窗口大小为τ的窗口中出现的次数，具体为：其中，和分别为Wfinal中索引为m和n的词；为词和的共现次数；|Wfinal|为最终分词结果中词的数量；为围绕为中心窗口大小为τ的窗口；基于共现矩阵，为每个词构建共现特征向量：其中，和分别为Wfinal中索引为1、2和|Wfinal|的词；为词的共现特征向量，包含该词与文本中其他词的共现频数；S22：计算点互信息：所述点互信息用于测量两个词共同出现的频率，具体为：其中，为词和词的点互信息；为词和词同时出现的概率，和分别为词和词出现的概率，和分别为词和词出现的频数；基于点互信息，为每个词构建点互信息特征向量：其中，所述步骤S3中，包括以下步骤：S31：设定输入和输出：利用基于深度学习的端到端语音合成网络Tacotron2作为自适应语音播报网络的框架，将播报文本以及S2步骤中提取出的上下文特征作为输入，输出预测的梅尔频谱图和停顿帧概率，具体为：Ymel,Ystop＝Tacotron2T,V1,V2|θ其中，V1和V2分别为根据S1、S2步骤提取出的播报文本的共现特征和点互信息特征；θ为自适应语音播报网络的参数；Ymel和Ystop分别为自适应语音播报网络预测出的梅尔频谱图和停顿帧概率；S32：设定损失函数：自适应语音播报网络的损失函数由三部分构成，梅尔频谱损失、停顿帧损失和动态时间弯曲损失，具体为：其中，和分别为梅尔频谱损失、停顿帧损失和动态时间弯曲损失；和为真实的梅尔频谱图和停顿帧，由人工对播报文本进行播报时提取得到；梅尔频谱损失使用均方误差表示，具体为：其中，U为时间帧的数量；Ymel,u和分别为预测出的梅尔频谱图和真实的梅尔频谱图在第u帧处的值；停顿帧损失使用交叉熵表示，具体为：其中，Ystop,u和分别为预测出的停顿帧和真实的停顿帧在第u帧处的值；动态时间弯曲损失通过定义成本矩阵、计算累计成本、找到最优路径以及计算损失实现，成本矩阵具体为：其中，x和y分别是预测出的梅尔频谱图和真实的梅尔频谱图中的时间帧；Ymel,x和分别为预测出的梅尔频谱图和真实的梅尔频谱图在第x帧和第y帧处的值；||·||为范数；使用动态规划方法计算从起点到成本矩阵每个点的最小累积成本，具体为：Dx,y＝costx,y+minDx-1,y-1,Dx-1,y,Dx,y-1其中，Dx,y是到达点x,y的最小累积成本；Dx-1,y-1是到达点x-1,y-1的最小累积成本；Dx-1,y是到达点x-1,y的最小累积成本；Dx,y-1是到达点x,y-1的最小累积成本；从成本矩阵的最后一个点U,U开始，追溯到起点1,1，找到成本最低的路径，最终的动态时间弯曲损失是最优路径累积的成本，具体为：其中，path为最优路径；Z为最优路径中点的总数。

全文数据：

权利要求：

百度查询：江苏华明国安技术有限公司基于上下文感知的自适应语音播报方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种高线吐丝管安装精确定位装置

下一篇：光检测装置

相关技术

一种高线吐丝管安装精确定位装置

光检测装置

一种玻璃瓶裂纹检测装置

一种塑料导气管成型设备

一种竹浆纸制备用破碎分削切片装置

一种粗氨气净化及制取液氨的装置及方法

马达

一种电网高影响天气特征与模式识别方法及系统

半导体用黏合膜、切割晶粒接合一体型膜及半导体装置的制造方法

化合物、有机电致发光元件用材料、有机电致发光元件和电子设备

电信网元实时处理方法、装置、设备、介质及程序产品

一种铸造用固化剂及其制备方法和使用方法

播报相关技术

一种电梯迎宾语音播报控制装置_宾达电梯(江苏)有限公司_202420688635.4

组播报文转发方法及装置_中国移动通信有限公司研究院_202011329743.5

一种基于人脸年龄检测的公交专座语音播报方法与装置_南京邮电大学_202210199578.9

基于上下文感知的自适应语音播报方法和系统_江苏华明国安技术有限公司_202410593684.4

一种语音播报的排队分诊叫号方法和系统_西藏医典健康数据管理有限公司_202410242665.7

一种多功能语音播报器_济南金正普科贸有限公司_202322062435.6

一种智能客服语音播报装置_惠州大亚湾华润燃气有限公司_202323464535.8

基于网约车导航的悬浮引导播报方法和装置_北京云行在线软件开发有限责任公司_202411307872.2

一种单播报文的转发方法、装置、设备及介质_北京神州数码云科信息技术有限公司_202411188597.7

一种语音播报方法、装置及计算机可读存储介质_数网金融有限公司_202111409082.1

语音相关技术

一种语音识别方法、语音识别装置、电子设备及存储介质_中移(苏州)软件技术有限公司_202010700307.8

一种基于矢量语音传感器阵列的语音增强方法及装置_中国电子科技集团公司第三研究所_202111055145.8

一种智能语音盒子及其控制方法、语音交互系统_杭州老板电器股份有限公司_202411202028.3

一种空管语音记录仪的语音分割方法及系统_广州市中南民航空管通信网络科技有限公司_202410943143.X

一种语音识别方法、装置和用于语音识别的装置_北京搜狗科技发展有限公司_201911383577.4

在内代理语音以促进任务学习_渊慧科技有限公司_202380031694.2

语音质量评估方法和装置_中国电信股份有限公司_202010795964.5

显示设备及语音服务切换方法_VIDAA美国公司_202110934009.X

语音控制启动的打火机_温州启点轻工有限公司_202420117861.7

用于语音拾取的质点振速传感器微阵列及语音拾取方法_中国电子科技集团公司第三研究所_202011429411.4

自适应相关技术

显示设备显示状态自适应调节装置、自适应调节方法_苏州德锐特成像技术有限公司_202411011299.0

自适应环境光补偿电路_上海申矽凌微电子科技股份有限公司_202411168282.6

高速内存总线时序自适应方法_成都电科星拓科技有限公司_202411269006.9

一种自适应鞋垫_深圳大学_202420631490.4

消除充气过量的自适应泄压型充气泵及自适应泄压方法_厦门粤沣医疗科技有限公司_202411248648.0

一种自适应跖骨假体_北京爱康宜诚医疗器材有限公司_202411448149.6

一种自适应火焰切割机_南通中赛自动化设备科技有限公司_202411451142.X

一种多轴驱动自适应轮椅_河南奕恒医疗器械有限公司_202011309455.3

自适应张力调节生产输送设备辊轴_宏淳辊轴科技启东有限公司_202420807607.X

外部知识的实例级自适应推进(IAPEK)_腾讯美国有限责任公司_202380027076.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于上下文感知的自适应语音播报方法和系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务