Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国地质大学(武汉)刘振焘获国家专利权

中国地质大学(武汉)刘振焘获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国地质大学(武汉)申请的专利一种基于视听双模态的说话人跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116485836B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310226945.4,技术领域涉及:G06F16/40;该发明授权一种基于视听双模态的说话人跟踪方法是由刘振焘;张龙博;张皓彦;石奇峰设计研发完成,并于2023-03-03向国家知识产权局提交的专利申请。

一种基于视听双模态的说话人跟踪方法在说明书摘要公布了:本发明公开了一种基于视听双模态融合的说话人跟踪方法,包括:通过摄像头与麦克风阵列分别获取说话人位置信息;融合声音与图像信息,根据图像中出现的人的数量和是否有语音输入的不同情况,进行说话人定位;根据不同的定位结果得出不同的运动控制指令,实时规划跟踪路径并驱动运动控制系统进行循迹,并为视觉模块未能检测到人的情况提供了利用语音定位信息来主动寻找说话人的方案,使其更加智能化。本发明最终实现移动机器人对说话人的实时跟踪,为人机交互提供便利。

本发明授权一种基于视听双模态的说话人跟踪方法在权利要求书中公布了:1.一种基于视听双模态融合的说话人跟踪方法,其特征在于,包括以下步骤: S1、通过摄像头与麦克风阵列分别获取图像和语音信息; S2、融合声音与图像信息,根据图像中出现的人的数量和是否有语音输入的不同情况,进行说话人定位; S3、根据定位结果实时规划跟踪路径并驱动运动控制系统进行循迹; 步骤S2具体为: S21、根据获取的图像和语音信息,确定一个待跟踪的人; S22、使用人体识别模型的矩形框锁定该人,通过模型返回矩形框的矩形框像素宽度和中心坐标; S23、将模型返回矩形框的矩形框像素宽度和中心坐标和已知的图像像素宽度和中心坐标带入如下距离计算模型和方位角计算模型中得出机器人的摄像头和人之间的距离和方位角: 其中,d为人体到摄像头的距离,x为物象占画面宽度的像素数,k为一个定值; 其中,χ为人体和摄像头光心的连线与摄像头光轴的夹角,β为摄像头的张角,为像素坐标系中标识框中心到画面两侧边缘距离之比; 步骤S21具体为: 当摄像头无法检测到人时,通过麦克风阵列捕获声音信息并输出方位角,依据方位角控制机器人运动; 当摄像头检测到多个人,且检测到有人说话,计算出机器人与各说话人之间的距离,锁定一个距离最近的说话人; 当摄像头检测到多个人,且未检测到有人说话,锁定一个距离最近的人; 当摄像头检测到单个人时,锁定该人。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国地质大学(武汉),其通讯地址为:430000 湖北省武汉市洪山区鲁磨路388号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。