一种基于语音识别的视频会议图像跟踪方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：深圳市北电正光科技有限公司

摘要：本发明属于通信技术领域，公开了一种基于语音识别的视频会议图像跟踪方法及系统，包括配置语音识别系统，对参会人员进行样本声音的采集，特征提取获得音频特征，和对应的个人身份信息存储于特征数据库；获取会议内的声音信息，通过语音识别技术识别当前发言人的声音特征，与特征数据库进行匹配，获取对应的个人身份信息；当前发言人移动时，根据声阈的变化驱动视频跟踪单元跟踪，并相应地更新其图像信息；结合声音传播特点连贯准确地追踪到发言人，对硬件要求更低，计算量相对较小，通过语音识别技术实现视频会议中的图像跟踪，降低了对环境条件的限制，显著提高了会议的互动性和管理效率，在各种场景下都能保持高效的识别和跟踪性能。

主权项：1.一种基于语音识别的视频会议图像跟踪方法，其特征在于，包括：配置语音识别系统，通过所述语音识别系统对参会人员进行样本声音的采集，并对采集的样本声音进行特征提取，获得音频特征，将所述音频特征和对应的个人身份信息存储于特征数据库；会议中，所述语音识别系统获取会议内的声音信息，通过语音识别技术识别当前发言人的声音特征；根据识别的所述声音特征与所述特征数据库进行匹配，获取对应的个人身份信息，在显示界面上显示视频跟踪单元获取的图像信息和对应的个人身份信息；所述语音识别系统持续获取会议内的声音信息，通过判断声音信息的波强变化，判断当前发言人是否移动；若否，则继续显示当前图像信息；若是，则根据声阈的变化驱动所述视频跟踪单元跟踪，并相应地更新其图像信息；其中，所述配置语音识别系统，通过所述语音识别系统对参会人员进行样本声音的采集，并对采集的样本声音进行特征提取，获得音频特征，将所述音频特征和对应的个人身份信息存储于所述特征数据库；具体包括：根据视频会议的使用需求，选择语音识别系统的偏好，并设定声音样本的采集参数；所述采集参数包括采样率、位深、声道数；设计一个用于采集声音样本的注册界面，使所述注册界面和参会人员的个人终端进行关联；通过所述注册界面引导参会人员在静音环境下录制声音样本，录制完成后，将采集的声音样本上传至语音识别系统的服务器端；采用声音处理算法对所述声音样本进行分析，提取出代表每个参会人员声音特性的音频特征；所述音频特征包括音高、音色、发音速度和语调模式；将提取出的音频特征与对应的个人身份信息共同存储在特征数据库中，其中，所述特征数据库设计有检索模块；对所述语音识别系统进行测试和验证，验证语音识别系统的准确性和响应速度；其中，所述根据识别的所述声音特征与所述特征数据库进行匹配，获取对应的个人身份信息，在显示界面上显示视频跟踪单元获取的图像信息和对应的个人身份信息；具体包括：启动特征匹配模块，所述特征匹配模块接收到所述语音识别系统识别的所述声音特征，采用特征匹配算法，从所述特征数据库中检索匹配的音频特征；根据检索到的音频特征，从所述特征数据库中调取对应的个人身份信息；将调取的所述个人身份信息与视频跟踪单元获取的实时图像信息进行整合，将所述个人身份信息嵌入到所述图像信息中；根据视频会议的布局要求，对整合后的所述图像信息和所述个人身份信息进行格式化处理；所述格式化处理包括调整信息显示的位置、大小和比例；将格式化后的图像信息和个人身份信息实时显示在视频会议的显示界面上；设置一个反馈机制，实时监控显示界面的图像清晰度、信息同步性和显示延迟，以评估显示效果的质量；其中，所述语音识别系统持续获取会议内的声音信息，通过判断声音信息的波强变化，判断当前发言人是否移动；具体包括：所述语音识别系统持续获取会议内的声音信息，并实时对所述声音信息进行更新；通过声音信号处理模块分析实时更新的声音信息的波强变化，并与样本声音的波强进行对比，以检测声音强度的微小变化值，将微小变化值对所述声音信息的波强变化进行补偿，获得全面波强变化值；根据获得的所述全面波强变化值与预设的波强阈值来比较，来判断当前发言人是否移动，当所述全面波强变化值位于所述波强阈值内时，则判断当前发言人没有移动；当所述全面波强变化值超出所述波强阈值时，则判断当前发言人为移动；其中，根据声阈的变化驱动所述视频跟踪单元跟踪，并相应地更新其图像信息；具体包括：通过分析声音信号的强度变化、频率变化及其时间序列的特征来确定声阈的变化，根据声阈的变化来判定发言人移动距离和方向的关键移动参数；所述视频跟踪单元接收到所述关键移动参数，评估所述关键移动参数对跟踪目标位置的影响，根据评估结果调整所述视频跟踪单元的跟踪算法参数；所述视频跟踪单元利用调整后的跟踪算法参数，应用图像识别和物体追踪技术执行图像捕捉工作，以锁定更新后的发言人位置并进行图像获取，获得更新的图像信息；所述视频跟踪单元将更新的图像信息与当前发言人的个人身份信息重新整合并在显示单元上显示；所述图像信息的更新过程中，根据环境变化的动态响应对所述视频跟踪单元的跟踪算法参数进行误差补偿；所述环境变化包括环境光线变化、非发言人的移动；根据所述视频跟踪单元的跟踪效果，优化所述声阈变化的判断阈值，以及图像识别和物体追踪技术的运行参数。

全文数据：

权利要求：

百度查询：深圳市北电正光科技有限公司一种基于语音识别的视频会议图像跟踪方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：包裹暴力分拣的检测方法、装置、计算机设备和存储介质

下一篇：一种翻译方法、翻译装置和计算机可读存储介质

相关技术

包裹暴力分拣的检测方法、装置、计算机设备和存储介质

一种翻译方法、翻译装置和计算机可读存储介质

处理网络游戏异常的方法、装置、存储介质及计算机设备

头孢维星衍生物中间体的制备方法

针刺式固晶机

基于IPV6的分段路由报文的转发方法、配置方法及设备

一种流量控制阀

一种基于人机混合智能的综合科技服务链集成系统及方法

终端的屏幕组件和终端设备

一种智能型链条张紧装置

一种基于多尺度特征与梯度融合操作的云图识别方法

对象创新评测方法、客户端及系统

视频会议相关技术

移动式视频会议设备_漳州职业技术学院_202420774854.4

视频会议的处理方法、系统和电子设备及存储介质_视联动力信息技术股份有限公司_202411152682.8

视频会议的迁移方法、装置、电子设备和存储介质_中移互联网有限公司_202311086954.4

一种面向IMS交换网多场景下视频会议安全接入方法_国网甘肃省电力公司庆阳供电公司_202411301220.8

分布式音视频处理系统、音视频编解码节点及音视频系统_广东畅视科技有限公司_202210623430.3

一种视频喉镜_深圳市保安医疗用品有限公司_202323570010.2

斗轮机视频监控设备_广东粤电大埔发电有限公司_202323402875.8

高效实时视频拼接方法_中国人民解放军海军航空大学_202411139385.X

一种视频文件输出方法、装置及视频文件播放方法_联想(北京)有限公司_202411155137.4

视频业务感知方法、装置、视频传输设备及接收设备_中国移动通信有限公司研究院_202010905409.3

图像相关技术

图像处理装置和图像处理方法_索尼集团公司_202080043358.6

图像编码/解码设备和发送图像数据的设备_LX半导体科技有限公司_202411300296.9

图像编码/解码方法和图像数据的传输方法_LX半导体科技有限公司_202411317982.7

运动图像编码装置以及运动图像解码装置_夏普株式会社_201980085198.9

图像处理装置、相机系统和图像处理方法_索尼半导体解决方案公司_201980075070.4

图像生成辅助装置以及图像生成辅助方法_发那科株式会社_202180010036.6

图像编码/解码设备和发送图像数据的设备_LX半导体科技有限公司_202411300011.1

图像编码/解码设备和发送图像数据的设备_LX半导体科技有限公司_202411300015.X

图像处理装置、图像处理方法以及片材_松下知识产权经营株式会社_201980076798.9

图像处理装置、图像处理方法以及程序_株式会社东芝_201980073242.4

跟踪相关技术

环路跟踪方法及装置_武汉梦芯科技有限公司_202410979931.4

一种自动可变跟踪模态的多目标在线跟踪方法_东南大学_202111661412.6

具有电磁跟踪的书写设备_谷歌有限责任公司_201980066373.X

基于FPGA的动态目标跟踪系统及其检测方法_东南大学_202210229821.7

跟踪在线协作电子文档中的内容归因_谷歌有限责任公司_201980057904.9

一种用于空中目标跟踪的转台_中国人民解放军空军工程大学_202420352755.7

一种激光跟踪仪高度调整装置_为度科创检测技术(苏州)有限公司_202420317526.1

低截获概率下联合抗干扰和跟踪的多维雷达资源调度方法_哈尔滨工业大学_202410829112.1

一种能自动跟踪太阳运动轨迹的系统及方法_北京慧碳众和资源科技有限公司_202411033887.4

一种人脸检测和跟踪的方法、装置、电子设备和存储介质_云知声(上海)智能科技有限公司_202110616942.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于语音识别的视频会议图像跟踪方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务