恭喜上海岩芯数智人工智能科技有限公司李骋远获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海岩芯数智人工智能科技有限公司申请的专利一种基于网格图的视频描述生成方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119815139B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510300684.5,技术领域涉及:H04N21/84;该发明授权一种基于网格图的视频描述生成方法、系统及存储介质是由李骋远设计研发完成,并于2025-03-14向国家知识产权局提交的专利申请。
本一种基于网格图的视频描述生成方法、系统及存储介质在说明书摘要公布了:本发明提供了一种基于网格图的视频描述生成方法,包括:S101、获取原始视频V;S102、从获取的原始视频V中等间距抽取k帧第一图像;其中,k应当满足被开平方;每一帧第一图像的大小为W×H×C;S103、构建一张大小为W×H×C的空图I,将空图I划分为个大小为W×H×C的块;S104、将k帧第一图像由左至右、由上至下,顺序置于空图I的k个大小为W×H×C的块中,得到大小为W×H×C的第二图像;S105、将得到大小为W×H×C的第二图像调整成大小为T×T×C的第三图像;S106、将大小为T×T×C的第三图像和生成类文本一起输入到LVLM模型中,输出生成的视频描述。本发明减少视频描述生成的计算复杂度,保证了视频描述的生成质量。
本发明授权一种基于网格图的视频描述生成方法、系统及存储介质在权利要求书中公布了:1.一种基于网格图的视频描述生成方法,其特征在于,所述视频描述生成方法包括如下方法步骤:S101、获取原始视频V;S102、从获取的原始视频V中等间距抽取k帧第一图像;其中,k应当满足被开平方;每一帧第一图像的大小为W×H×C;其中,W表示每一帧第一图像的长度,H表示每一帧第一图像的宽度,C表示原始视频V的通道数;S103、利用抽取的k帧第一图像,计算原始视频V的光流分数;若光流分数低于预设阈值,则丢弃原始视频V,重新获取原始视频V;若光流分数高于预设阈值,则构建一张大小为W×H×C的空图I,将空图I划分为个大小为W×H×C的块;其中,k为从获取的原始视频V中等间距抽取的第一图像的帧数;S104、将k帧第一图像由左至右、由上至下,顺序置于空图I的k个大小为W×H×C的块中,得到大小为W×H×C的第二图像;S105、将得到大小为W×H×C的第二图像调整成大小为T×T×C的第三图像;其中,T表示第三图像的长度和宽度;S106、将大小为T×T×C的第三图像和生成类文本一起输入到LVLM模型中,输出生成的视频描述。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海岩芯数智人工智能科技有限公司,其通讯地址为:201203 上海市浦东新区博霞路11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。