深圳市超时代软件有限公司廖国波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市超时代软件有限公司申请的专利一种基于人工智能的文本至视频转换系统及其控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118214907B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410256540.X,技术领域涉及:H04N21/43;该发明授权一种基于人工智能的文本至视频转换系统及其控制方法是由廖国波设计研发完成,并于2024-03-06向国家知识产权局提交的专利申请。
本一种基于人工智能的文本至视频转换系统及其控制方法在说明书摘要公布了:本申请提供了一种基于人工智能的文本至视频转换系统及其控制方法,通过启动人工智能多媒体监测,获取待转录文本的信息赋载数据序列,根据稀疏字符嵌入量和稠密字符嵌入量确定堆叠字符索引集合,根据通配文本标签提取对应的高频字符散列量,进而确定起始词条收敛数据,由起始词条收敛数据确定词条时序滑动跨度,根据视频线性步进序列和词条时序滑动跨度确定泛化字符流动融合阈,通过泛化字符流动融合阈确定视频匹配调和度,将预设文本视频描述反馈量与视频匹配调和度进行对比,将视频匹配调和度作为视频变帧调谐增益,对文本视频变帧描述进行反馈控制,可在不定长的文本至视频转换时,提高文本和视频的同步匹配能力。
本发明授权一种基于人工智能的文本至视频转换系统及其控制方法在权利要求书中公布了:1.一种基于人工智能的文本至视频转换控制方法,其特征在于,包括如下步骤:启动人工智能多媒体监测,获取待转录文本的信息赋载数据序列,根据所述信息赋载数据序列确定稀疏字符嵌入量和稠密字符嵌入量;根据所述稀疏字符嵌入量和所述稠密字符嵌入量确定堆叠字符索引集合,由所述堆叠字符索引集合确定通配文本标签,根据所述通配文本标签提取对应的高频字符散列量;通过所述高频字符散列量确定混合字符交叉熵,根据所述混合字符交叉熵确定起始词条收敛数据,由所述起始词条收敛数据确定词条时序滑动跨度;获取视频音轨图帧数据对应的视频线性步进序列,根据所述视频线性步进序列和所述词条时序滑动跨度确定泛化字符流动融合阈,通过所述泛化字符流动融合阈确定视频匹配调和度;词条时序滑动跨度可采用下述公式确定,即: 其中,表示词条时序滑动跨度,表示通配文本标签的自然流动因子,表示字符在文本中的第个起始词条标签,,表示在文本中起始词条标签个数,表示起始词条标签获取词条滑动帧率,表示词条垂直同步参量,表示以e为底数的指数函数,表示在文本中非起始词条标签的第个字符,表示文本中非起始词条标签字符的个数;词条时序滑动跨度有助于在人工智能的文本至视频转换中更好地理解和捕捉时间序列数据中的模式和趋势,进而提高文本至视频转换的同步匹配能力;通配文本标签的自然流动因子是指文本至视频转换过程中通过自然语言模型对文本进行识别后,判定文本中字符根据视频刷新率实时调节的可变参数,可通过多次训练后的文本刷新率算法获取自然流动因子;词条滑动帧率是指在文本开始随视频同步流动时,视频播放中存在两个时间点与起始词条标签中任一字符相重合时的时间间隔内视频的帧数,时间间隔是起始词条标签中字符的起始朗读时间和结束朗读时间的时间差,可根据执行滚动动画性能监测程序测量得到词条滑动帧率;词条垂直同步参量是指在文本和视频同步播放的过程中防止视频掉帧和文本字符流动不搭配的调节参数;泛化字符流动融合阈可采用下述公式确定,即: 其中,表示泛化字符流动融合阈,表示词条时序滑动跨度,表示音频暂滞泛化因子,表示视频线性步进序列的动画图帧切换频度,表示视频线性步进序列的声音步进衔接度,表示视频线性步进序列中动画图帧的流动数量,表示视频线性步进序列中图帧线性步进可调参量,表示视频线性步进序列中声音滚动速率可调参量,表示文本和视频同步非稳定衔接度,表示视频线性步进序列中声音播放速时间,表示视频线性步进序列中动画图帧的流动时间;泛化字符流动融合阈表示字符流动速率;动画图帧切换频度表示视频线性步进序列中动画图帧的流动数量和动画图帧的流动时间的变化量;声音步进衔接度表示视频线性步进序列中动画图帧的流动数量和声音播放速时间的变化量;音频暂滞泛化因子表示文本朗读断句时停顿时间的变化量具有语言模型泛化量的参数;视频线性步进序列中图帧线性步进可调参量是指用户根据视频线性步进情况可手动调节的可变控制参数,其作用是通过调节图帧线性步进可调参数进而让视频图帧更加流畅的运行,视频线性步进序列中声音滚动速率可调参量是视频线性步进序列中声音随视频动画的播放的自然流畅度的控制参量,是根据视频播放进度进行自动匹配的,通常是根据设定程序代码实现的;文本和视频同步非稳定衔接度是指在文本和视频同步流动的过程中,视频流动时间超前文本流动时间的差值或视频流动时间滞后文本流动时间的差值;视频线性步进序列中动画图帧的流动数量是指在视频中所有动画图帧的总数;视频线性步进序列中声音播放速时间是指在一帧动画图帧流动的时间作为该帧动画图像对应的声音播放的始末时间;视频线性步进序列中动画图帧的流动时间是指在视频播放过程中每帧动画图帧从出现到下一帧动画图帧出现的时间;通过所述泛化字符流动融合阈确定视频匹配调和度可采用下述步骤实现:获取泛化字符流动融合阈;获取通配文本标签的总数;根据待转录文本的信息赋载数据序列确定字符总段数;确定待转录文本的信息赋载数据序列中第段字符对应的文本描述量;确定第段字符对应的第段视频动画帧长描述量;根据泛化字符流动融合阈、通配文本标签的总数、待转录文本的信息赋载数据序列对应的字符总段数、待转录文本的信息赋载数据序列中第段字符对应的文本描述量和第段字符对应的第段视频动画帧长描述量确定视频匹配调和度,其中,视频匹配调和度可采用下述公式确定: 其中,表示视频匹配调和度,表示待转录文本的信息赋载数据序列的总文本描述量,,表示待转录文本的信息赋载数据序列的文本描述总量对应的视频动画帧长总描述量,,表示以自然常数e为底数的对数,表示以e为底数的指数函数,表示文本至视频转换中文本描述异步指征,表示文本至视频转换中视频描述异步指征;通配文本标签的总数指通配文标签中包含的所有字符的总数,待转录文本的信息赋载数据序列确定字符总段数是指输入的一句或一段待转录文本的字符按照正常语序一个标点符号划分为一段,进而得到总段数,待转录文本的信息赋载数据序列中第段字符对应的文本描述量是指待转录文本的信息赋载数据序列中第段字符在视频中播放的时间,,第段字符对应的第段视频动画帧长描述量是指第段字符对应的第段视频动画帧长在视频中播放的时间,,待转录文本的信息赋载数据序列的文本描述总量对应的视频动画帧长总描述量是指待转录的文本字符序列在视频中播放的总时间,待转录文本的信息赋载数据序列的文本描述总量对应的视频动画帧长总描述量是指待转录文本的信息赋载数据序列的文本描述总量对应的视频动画帧长在视频播放中的总时间,文本至视频转换中文本描述异步指征是指在文本至视频转换过程中每段文本字符与对应视频帧长时间的比值,文本至视频转换中视频描述异步指征是指文本至视频转换过程中视频播放总时间与所有字符段播放时间的差值;视频匹配调和度表示视频和文本的关联程度;将预设文本视频描述反馈量与所述视频匹配调和度进行对比,当所述视频匹配调和度大于预设文本视频描述反馈量时,将所述视频匹配调和度作为视频变帧调谐增益,对文本视频变帧描述进行反馈控制。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市超时代软件有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道麻岭社区高新中二道2号深圳软件园7栋一单元302-8;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。