新华三智能终端有限公司吴杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉新华三智能终端有限公司申请的专利基于机器视觉发言人追踪定位方法、网络设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116152912B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211502517.1,技术领域涉及:G06V40/20;该发明授权基于机器视觉发言人追踪定位方法、网络设备及存储介质是由吴杰设计研发完成,并于2022-11-28向国家知识产权局提交的专利申请。
本基于机器视觉发言人追踪定位方法、网络设备及存储介质在说明书摘要公布了:本申请提供了基于机器视觉发言人追踪定位方法、网络设备及存储介质,其中,方法包括获取包含有人员张嘴的场景图片;通过场景图片获取人脸感兴趣区域以及嘴部关键点坐标;对人脸感兴趣区域以及嘴部关键点坐标进行归一化处理;将归一化后的人脸感兴趣区域与缓存的人脸感兴趣区域的面积取交集;将交集面积大于设定阈值a人脸感兴趣区域放置同一队列;当放置同一队列的图片数量超过设定阈值b,则计算归一化后嘴部关键点坐标的方差,通过方差大小判断当前检测人员是否在说话。本申请实施例基于机器视觉进行发言人跟踪,不受场景内噪音影响,即使有多人同时讲话,也能识别出发言人,甚至是主发言人和次发言人。
本发明授权基于机器视觉发言人追踪定位方法、网络设备及存储介质在权利要求书中公布了:1.一种基于机器视觉发言人追踪定位方法,其特征在于,包括: 获取包含有人员张嘴的场景图片; 通过场景图片获取人脸感兴趣区域以及嘴部关键点坐标; 对所述人脸感兴趣区域以及嘴部关键点坐标进行归一化处理; 将所述归一化后的人脸感兴趣区域与缓存的人脸感兴趣区域的面积取交集; 将交集面积大于设定阈值a的归一化后的人脸感兴趣区域与缓存的人脸感兴趣区域放置同一队列; 当与缓存的人脸感兴趣区域同一队列的归一化后的人脸感兴趣区域的图片数量超过设定阈值b,则计算所述归一化后人脸所对应嘴部关键点坐标的方差,通过方差大小判断当前检测人员是否在说话; 判断当前是否存在被追踪的主发言人; 若存在被追踪主发言人,则将当前检测的人脸感兴趣区域与被追踪主发言人的人脸感兴趣区域面积取交集; 若交集面积大于设定阈值c,且判断当前检测人员在说话,则当前检测人员为主发言人; 若交集面积大于设定阈值c,判断当前检测人员未在说话,且未说话时间超过设定时间t,则判断不再存在被追踪主发言人,重新确认主发言人; 若交集面积大于设定阈值c,判断当前检测人员未在说话,但未说话时间未超过设定时间t,则当前检测人员为主发言人; 在交集面积大于设定阈值c,判断当前检测人员未在说话,但未说话时间未超过设定时间t,则当前检测人员为主发言人情况下,若存在新增说话人,则根据判断当前检测人员所运用的人形检测模型、人脸检测模型以人脸关键点检测模型时得到的置信度值计算当前检测人员为说话人的概率,将概率最高者作为次发言人。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人新华三智能终端有限公司,其通讯地址为:510555 广东省广州市黄埔区中新知识城亿创街1号406房之100;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励