浙江大学周晟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于OCR和颜色预处理的背景复杂变化场景下电影字幕提取方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119763090B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411815294.3,技术领域涉及:G06V20/62;该发明授权基于OCR和颜色预处理的背景复杂变化场景下电影字幕提取方法和装置是由周晟;吴雨轩;卜佳俊;沈铭;李亮城设计研发完成,并于2024-12-11向国家知识产权局提交的专利申请。
本基于OCR和颜色预处理的背景复杂变化场景下电影字幕提取方法和装置在说明书摘要公布了:本发明公开一种基于OCR和颜色预处理的背景复杂变化场景下电影字幕提取方法和装置,所述方法通过事先截取定位电影字幕位置,提取电影字幕颜色信息特征,根据字幕颜色预处理提取字幕文本,改进优化了传统的电影字幕提取方法由于背景元素混淆、色彩变化等原因,而导致的字幕提取效果不佳。本发明有助于提高提高OCR在电影场景中的识别精度,并在保证效率的同时,克服了背景复杂性带来的挑战。
本发明授权基于OCR和颜色预处理的背景复杂变化场景下电影字幕提取方法和装置在权利要求书中公布了:1.基于OCR和颜色预处理的背景复杂变化场景下电影字幕提取方法,其特征在于,包括以下步骤: S110,采样电影帧获取文字框具体位置,从中随机采样出多张图片帧,对于这些图片帧,通过OCR方法来获取出所有文字框位置;所述的采样电影帧获取文字框具体位置,具体包括: S1101,对于一部电影从中随机采样出n张图片帧; S1102,对于n张图片帧,通过OCR方法计算出所有文字框位置,记文字框个数为; S1103,用表示文字框的具体位置,X、Y为文字框的中心点坐标,H为文字框的高; S120,利用聚类算法获得字幕位置信息,对于文字框聚类,得到类别中个数最多的类,将其中心点坐标作为字幕位置的中心点,统计所属中心点坐标这一类中,文字框高度的众数,作为字幕位置的高度,将电影的宽度,作为字幕位置的宽度; S130,根据像素点众数计算字幕颜色特征;具体包括: S1301,针对S1101采样出的图片帧,利用字幕位置截取电影图片,用Imgi,j表示截取图片的像素值; S1302,针对截取图片中的每一列像素,统计其中个数最多的像素值,也就是每一列中像素值的众数,用Cj表示每一列的像素值众数; S1303,计算{C1,…,Cj,…,Cw}中的众数,记作M,其中w为图片像素的列数; S1304,对于所有截取图片帧,重复上面操作,统计{M}中的像素值众数作为字幕颜色信息特征; S140,根据字幕颜色预处理提取字幕文本;具体包括: S1401,提取电影中的所有图片帧,按字幕位置截取图片; S1402,对截取后的图片,进行二值化操作,将像素值等于字幕颜色特征的置为255,将像素值不等于字幕颜色特征的置为0; S1403,对于二值化操作后的图片,送入OCR中进行字幕文字提取。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。