恭喜随锐科技集团股份有限公司何平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜随锐科技集团股份有限公司申请的专利一种基于语音频谱域稀疏性约束的在线语音分离方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113889139B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111095119.8,技术领域涉及:G10L21/0272;该发明授权一种基于语音频谱域稀疏性约束的在线语音分离方法和装置是由何平;蒋升设计研发完成,并于2021-09-17向国家知识产权局提交的专利申请。
本一种基于语音频谱域稀疏性约束的在线语音分离方法和装置在说明书摘要公布了:本发明公开了一种基于语音频谱域稀疏性约束的在线语音分离方法和装置,属于信息处理的领域,该方法包括以下步骤:S1:对每个麦克风的时域信号进行短时傅里叶变换得到时频域表达,并构建频域原始向量;S2:根据目标语音相对麦克风阵列的方向,构建维度为2×M的初始化分离矩阵;S3:构建优化函数,并计算用于分离目标语音与剩余信号的分离矩阵;S4:根据计算的分离矩阵,得到目标语音的频域信号,进而得到目标语音时域信号。本发明基于语音信号在频谱域的稀疏性的特点,设计了新的优化函数,不需要预白化处理,可以保证会议通讯的实时性。
本发明授权一种基于语音频谱域稀疏性约束的在线语音分离方法和装置在权利要求书中公布了:1.一种基于语音频谱域稀疏性约束的在线语音分离方法,应用于基于麦克风阵列的系统,其特征在于,包括以下步骤:S1:对每个麦克风的时域信号进行短时傅里叶变换得到时频域表达,并构建频域原始向量;S2:根据目标语音相对麦克风阵列的方向,构建维度为2×M的初始化分离矩阵;所述步骤S2中,初始化的分离矩阵为: 其中,目标语音分离矩阵初始化为: qθ=[cosθ,sinθ];其中,fk为第k个频带的频率,k=1,2,...K,其中K的取值是根据后续傅里叶变换来确定,如果帧长为512,那么K的取值为帧长的一半;c为声速;dM为第M个麦克风的二维坐标值;θ为目标语音相对麦克风阵列的方向,qθ为方向矢量,ωk为频带圆频率;剩余信号分离矩阵初始化为0向量:G20,k=[0,0,....,0];S3:构建优化函数,并计算用于分离目标语音与剩余信号的分离矩阵;所述步骤S3包括:S301:构建新的优化函数JGk: y1l,k=G1kXl,k,y2l,k=G2kXl,k其中,α为权重因子;y1l,k和y2l,k分别代表基于分离矩阵得到目标语音和剩余信号频域估计;Xml,k为第m个麦克风信号,在第l帧,第k个频带的频谱,Xl,k为频域原始向量;S302:计算优化函数的梯度向量: S303:根据上一帧分离矩阵和梯度下降法更新分离矩阵:G1l,k=G1l-1,k-εΔG1kG2l,k=G2l-1,k-εΔG2k其中,G1l,k和G2l,k分别为用于分离目标语音与剩余信号的分离矩阵;∈代表每一次更新的步长;S4:根据计算的分离矩阵,得到目标语音的频域信号,进而得到目标语音时域信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人随锐科技集团股份有限公司,其通讯地址为:100192 北京市海淀区宝盛南路1号奥北科技园19号楼北京随锐中心;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。