一种粤语新闻视频中自动裁剪含主播的视听数据集的方法

导航：龙图腾网> 最新专利技术> 一种粤语新闻视频中自动裁剪含主播的视听数据集的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：东南大学

摘要：本发明公开了一种粤语新闻视频中自动裁剪含主播的视听数据集的方法，该方法把粤语新闻视频裁剪为视频、语音两个模态的数据集合，其中每一段数据都只包含主持人进行新闻播报的场景。该方法基于HSV图像信息检测算法进行整个新闻场景的分割，基于FaceRecognition人脸检测库和人脸特征提取工具进行包含目标主播人脸的视频识别，基于语音活动检测算法对音频进行切分，再根据切分停顿点对视频进行切分，实现自动完成粤语新闻中裁剪含主播的视听数据集的制作。通过设计的合理的流程和使用高效的算法，提高了构建粤语高质量视听数据集的效率，并能够方便地推广到其他语言的视听数据集制作中，最终能应用于如粤语场景下语音去噪、音视频驱动的人脸生成模型的训练中。

主权项：1.一种粤语新闻视频中自动裁剪含主播的视听数据集的方法，其特征在于，具体步骤如下：步骤1，视频场景分割，1.1，收集电视台公开的粤语新闻播报视频，视频中新闻主播需要使用粤语播报新闻；1.2，使用一种基于HSV图像信息的检测算法处理1.1中的视频，根据场景信息的变化得到切割后的不同场景的视频；步骤2，目标人脸分类，2.1，使用人脸检测工具FaceRecognition检测得到的场景视频中的人脸，对于不包含人脸或者包含一个以上人脸的视频将会直接丢弃；2.2，对于只包含一个人脸的场景视频，使用FaceRecognition计算该人脸和目标主播人脸的128维度人脸特征向量；2.3，计算2.2中两个特征向量的余弦相似度，若大于设定的阈值，则认为该场景视频为仅包含目标主播播报的视频片段，将其加入该目标主播文件夹中，否则丢弃该视频；步骤3，语音后处理，3.1，对于目标主播文件夹中的视频，使用FFmpeg工具提取视频对应的音频；3.2，利用语音活动检测VoiceActivityDetection,VAD方法，对语音中出现的停顿进行检测并分割，同时会得到分割的停顿点信息，该步骤形成音频模态的数据；3.3，利用分割的停顿点信息去切分对应的视频，得到与音频片段对应的视频片段，该步骤形成视频模态的数据；其中，步骤1中所选择的一种基于HSV图像信息的检测算法能够比较相邻两帧图像之间HSV信息的变化量，如果该变化量超过所设定的阈值，则认为视频在此处发生场景变化；视频中的一帧图像是三通道的RGB数据，首先将其转换为三通道的HSV数据，转换方式如公式1-3所示：V＝maxR,G,B1 其中，R、G、B分别为每个像素的红绿蓝三个通道的值，若计算后的H值小于0，则H＝H+360，将饱和度S和亮度V扩大255倍，色调缩小为原始的一半，最终得到HSV格式的数据也是一种包含三个通道的数据，得到两张相邻视频帧的HSV格式的数据后，再去计算相邻两张图片的每个像素每个通道的HSV数据的平均差值，如果这个差值大于设置的阈值，则说明场景变化较大，即在此处发生了场景的切换，具体计算差值的方式如公式4所示，其中Flast和Fcurrent表示上一帧与当前帧的HSV格式像素值，m,n表示视频帧的高度和宽度大小，i表示当前计算的是第i个通道的数据，score表示两帧之间的差异评分，评分越高代表它们之间的差异度越大，越有可能作为场景的切换点，将阈值设置在27。

全文数据：

权利要求：

百度查询：东南大学一种粤语新闻视频中自动裁剪含主播的视听数据集的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种有限空间内微小水雾聚集排出装置

下一篇：伽玛参考电压发生电路、伽玛参考电压发生方法及芯片

相关技术

一种有限空间内微小水雾聚集排出装置

伽玛参考电压发生电路、伽玛参考电压发生方法及芯片

纵置双向锥度离合自适应变速手动前后换挡电驱动系统

管体、内窥镜及装配方法、约束结构的成型方法、治具

提升料理机

一种塑料粒子均匀进料加工装置

一种履腿平衡式移动机器人及方法

基于数据库链接的数据迁移方法、装置、设备及介质

一种熔断器及熔断器生产方法

一种多车型前悬拧紧机构自动切换机构

一种高柔性高热稳定性的正温度系数复合材料的制备方法

灵芝谷蜂蜜醋

含相关技术

一种含硫尾矿与含硫废石协同处理的方法_广州市华石科能科技投资有限公司_202411144657.5

含天然油的洗发剂_陶氏环球技术有限责任公司_202380022843.9

含多个二硝酰胺阴离子的含能盐及其制备方法和固体推进剂含能氧化剂_湖北航天化学技术研究所_202410752391.6

含硫气体脱硫的反应器和方法、含硫气体连续脱硫的装置和方法_中国石油化工股份有限公司_202111075198.6

一种包装口含烟的装置、包装口含烟的系统及包装方法_上海新型烟草制品研究院有限公司_201910008573.1

化工含磷废渣全效利用方法_铜陵化工集团化工研究设计院有限责任公司_202410785486.8

一种含硫烟气余热回收系统_湖南山水节能科技股份有限公司_202420224872.5

用于合成含精氨酸的肽的方法_帝斯曼知识产权资产管理有限公司_201980037204.3

一种含氨尾气的处理方法_湖北绿钨资源循环有限公司_202410725079.8

一种适用于含能材料生产的物料分配系统_杭州永昆科技有限公司_202323631163.3

自动相关技术

自动入网、自动连接方法、系统、设备及介质_华为技术有限公司_202110184819.8

自动检票闸机及自动检票系统_北京国铁华晨通信科技有限公司_202411046039.7

自动套袋机构_常州雁衡智能科技有限公司_202411060153.5

荷叶自动采摘机_漳州天荷茶业有限公司_202420360605.0

管道自动清洗装置_姚文_202420291743.8

自动分析装置_株式会社日立高新技术_202411091759.5

自动驾驶车辆_丰田自动车株式会社_202110226759.1

自动治疗规划_阿莱恩技术有限公司_202210933712.3

自动注油机_湖南爱美人新能源有限公司_202411023310.5

自动装配设备_广东新宝电器股份有限公司_201710948310.X

裁剪相关技术

一种服装裁剪设备及其裁剪服装的方法_三威龙(福建)服饰织造有限公司_202411246381.1

一种服装生产裁剪装置_项城市祥龙制衣有限公司_202322857658.1

反渗透膜膜片裁剪设备_蓝膜环保(山东)有限公司_202420644369.5

一种布料裁剪辅助机构_成都耀扬服饰有限公司_202420171033.1

一种布料裁剪机构_响水鑫创服饰有限公司_202411228243.0

一种纸托裁剪装置_淮安环创包装科技有限公司_202420062142.X

一种塑料编织布裁剪装置_沈阳华源塑业有限公司_202420195049.6

浸胶帆布生产用浸胶机裁剪装置_江苏佳恒化纤有限公司_202420017030.2

一种电感线圈用裁剪机构_广东乔晶智能电器科技有限公司_202323388505.3

一种电视机胶带裁剪装置_安徽康佳电子有限公司_202411132815.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种粤语新闻视频中自动裁剪含主播的视听数据集的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务