Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于音视频会议的双讲检测方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:宁波蛙声科技有限公司

摘要:本发明公开了一种用于音视频会议的双讲检测方法及装置,包括以下步骤:采集近端待测输入信号和远端回声消除输出信号作为两路输入信号;对两路输入信号进行数据处理及相关性计算,得到相关性平滑数值,并持续对相关性平滑数值进行更新;判断远端存在语音输入时,若相关性数值大于等于预先设置的阈值,则判定近端和远端通话状态为双讲状态。本发明能够有效提高双讲检测结果的稳健性和可靠性,提升实时会议语音及播放效果。

主权项:1.一种用于音视频会议的双讲检测方法,其特征在于:包括以下步骤:采集近端待测输入信号和远端回声消除输出信号作为两路输入信号;对两路输入信号进行数据处理及相关性计算,得到相关性平滑数值,并持续对相关性平滑数值进行更新;判断远端存在语音输入时,若相关性数值大于等于预先设置的阈值,则判定近端和远端通话状态为双讲状态;将两路输入信号分别加窗,进行短时快速傅里叶变换到频域,在频域上,对两路输入信号数据求取相关性;在频域上,对两路输入信号数据求取相关性:Sxy=alpha*Sxy+1-alpha*X*conjYCxy=SxysqrtSxy^2其中,Sxy是互相关结果,alpha为平滑因子,X表示近端待测输入信号数据复数形式,Y表示远端回声消除输出信号数据复数形式,conj表示取共轭,Cxy为最终的相关性结果;平滑后的相关性数值为Smooth_Cxy,所述Smooth_Cxy按以下公式进行更新:Smooth_Cxy=beta*Smooth_Cxy+1-beta*Cxy其中,beta为平滑因子;所述平滑因子beta的值取决于语音存在概率值,所述语音存在概率值为0-1之间的浮点数,当语音存在概率值大于0.9时,beta为0.9;当语音存在概率值小于0.9时,beta值从0.9逐步增大到0.99;当语音存在概率值小于0.5时,beta值为1,Smooth_Cxy停止更新。

全文数据:

权利要求:

百度查询: 宁波蛙声科技有限公司 一种用于音视频会议的双讲检测方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。