恭喜深圳市海威恒泰智能科技有限公司张海焦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜深圳市海威恒泰智能科技有限公司申请的专利视频处理方法、装置、设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119418704B 。
龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510007132.5,技术领域涉及:G10L15/26;该发明授权视频处理方法、装置、设备、存储介质及程序产品是由张海焦;刘鹏设计研发完成,并于2025-01-03向国家知识产权局提交的专利申请。
本视频处理方法、装置、设备、存储介质及程序产品在说明书摘要公布了:本申请公开了一种视频处理方法、装置、设备、存储介质及程序产品,涉及数据处理技术领域,包括:若检测到视频播放设备输出当前播放视频,则通过预设麦克风采集所述视频播放设备所处外界环境的环境音频信号;从所述环境音频信号中提取语音信号,并将所述语音信号输入预设的语音识别模型得到语音识别文本;基于所述语音识别文本确定所述当前播放视频的专业领域,基于所述专业领域对应预设的词汇库对所述语音识别文本进行调整,得到目标识别文本;将所述目标识别文本和所述当前播放视频关联保存至预设存储空间。本申请实现了提高语音转录的准确性。
本发明授权视频处理方法、装置、设备、存储介质及程序产品在权利要求书中公布了:1.一种视频处理方法,其特征在于,所述视频处理方法包括:若检测到视频播放设备输出当前播放视频,则通过预设麦克风采集所述视频播放设备所处外界环境的环境音频信号;从所述环境音频信号中提取语音信号,并将所述语音信号输入预设的语音识别模型得到语音识别文本,其中,所述语音识别模型为以历史语音信号为输入数据,以所述历史语音信号对应的识别文本为标签训练得到;基于所述语音识别文本确定所述当前播放视频的专业领域,从所述语音识别文本中提取专业词汇,从所述专业领域对应预设的词汇库检索与所述专业词汇的词汇语义一致以及词汇读音一致的校验词汇,若所述校验词汇和所述专业词汇不同,则通过所述校验词汇替换所述专业词汇,得到目标识别文本,其中,所述专业领域为所述当前播放视频的视频内容专业领域;将所述目标识别文本划分为多个识别子文本,遍历各个所述识别子文本,从所述语音信号中确定所述识别子文本对应的音频段,并确定所述音频段对应在所述当前播放视频中的视频段;若所述当前播放视频为学习类视频,则确定所述视频段在视频时间轴上的起始时间点和结束时间点,基于所述时间点和所述结束时间点确定目标时间段,按照所述目标时间段在所述识别子文本中添加时间戳得到语音转录文本;若所述当前播放视频为会议类视频,则从所述视频段中识别发言人物,并确定所述发言人物的人物身份信息,并通过所述人物身份信息标识所述识别子文本,得到所述语音转录文本;将所述语音转录文本和所述当前播放视频关联保存至预设存储空间;其中,所述语音识别模型包括不同语种对应的语音识别模型,所述将所述语音信号输入预设的语音识别模型得到语音识别文本的步骤,包括:确定所述语音信号对应的目标语种;若所述目标语种包括多种语种,则按照所述多种语种将所述语音信号划分为语音子信号,从所述不同语种对应的语音识别模型中确定与各所述语音子信号的语种对应的目标识别模型,将各个所述语音子信号输入各自对应的目标识别模型得到语种文本,按照各所述语音子信号在所述语音信号中的时序拼接各个所述语种文本,得到语音识别文本;若所述目标语种包括一种语种,则从所述不同语种对应的语音识别模型中确定与所述目标语种对应的目标识别模型,将所述语音信号输入所述目标语种对应的目标识别模型,得到所述语音识别文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市海威恒泰智能科技有限公司,其通讯地址为:518000 广东省深圳市龙岗区坂田街道岗头社区清湖工业区宝能科技园(南区)一期B区B1栋2401-1;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。