厦门大学戴君伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利一种语义分析模型训练方法、视频数据传输方法、电子设备及计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120236248B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510714521.1,技术领域涉及:G06V20/52;该发明授权一种语义分析模型训练方法、视频数据传输方法、电子设备及计算机可读存储介质是由戴君伟;高友炎;任晅;郭智雄;王海黎设计研发完成,并于2025-05-30向国家知识产权局提交的专利申请。
本一种语义分析模型训练方法、视频数据传输方法、电子设备及计算机可读存储介质在说明书摘要公布了:本发明公开了一种语义分析模型训练方法、视频数据传输方法、电子设备及计算机可读存储介质,属于人工智能与视频传输技术领域。该训练方法基于MobileViT‑S架构构建多任务融合网络,结合轻量化Transformer与卷积模块,同步提取视频中的目标、动作及场景语义信息。训练采用两阶段策略:预训练阶段使用通用数据集优化基础能力;微调阶段引入课程学习与时序平滑损失,逐步增加复杂海洋场景样本权重,联合优化多任务损失函数,动态调整权重平衡精度与带宽适配。船端部署该模型提取结构化语义信息;岸基通过GAN+Diffusion模型还原视频,结合光流插值、Kalman滤波提升时序一致性。由此解决了低带宽场景下视频实时传输难题,可应用于船舶监控、远程协作等领域,显著提升传输效率与可靠性。
本发明授权一种语义分析模型训练方法、视频数据传输方法、电子设备及计算机可读存储介质在权利要求书中公布了:1.一种语义分析模型训练方法,其用于船岸间视频数据传输,其特征在于,该方法包括以下步骤: 步骤1:构建语义分析模型,所述模型包括: 输入模块,接收RGB图像与光流信息并将其拼接为5通道进行输入; 主干网络,采用轻量化Transformer和卷积混合架构MobileViT‑S,并嵌入时空注意力机制; 多任务融合分支,包括目标检测分支、动作识别分支、场景编码分支,分别输出目标类别与位置、动作标签、场景标签; 动态特征选择模块,根据当前带宽状态动态关闭非关键任务分支; 步骤2:训练语义分析模型:采用两阶段训练策略,包括: 阶段一:在通用视频数据集上预训练,使用AdamW优化器与Focal Loss; 阶段二:在船岸场景数据上进行微调,采用课程学习策略逐步增加复杂样本权重,并加入时序平滑损失;其具体包括: 采集真实船岸监控视频,对其进行标注,标注信息包括目标类别,动作标签和场景标签; 模拟海上的雾气、海浪抖动、盐雾噪声进行数据增强; 设置课程学习策略,包括第1‑50epoch仅使用简单场景样本;第51‑100epoch逐步加入复杂场景样本,比例从20%提升至80%;第101‑150epoch全量复杂场景训练,并加入对抗样本; 设计多任务联合损失函数,引入时序平滑约束损失,联合损失函数为: ,其中: 目标检测的Focal Loss;: 动作识别的交叉熵损失;: 场景分类的标签平滑损失;: 时序平滑约束损失; 动态调整多任务分支权重:初始权重为α=1.0,β=0.8,γ=0.5,λ=0.2,其中α表示目标检测对应的权重,β表示动作识别对应的权重,γ表示场景分类对应的权重,λ表示时序平滑约束损失的权重;随着训练进度线性增加λ,最终λ=0.6; 其中,所述MobileViT‑S是由卷积层与Transformer模块交替堆叠,共包含6个阶段Stage1~Stage6;其中,Stage1、Stage3和Stage5的模型类型为Conv2D+BN+Swish,Stage2和Stage4的模型类型为MobileViT Block,Stage6的模型类型为Global Context Transformer; 所述时空注意力机制,是在Transformer层中引入3D时空位置编码,捕获视频帧间的时序依赖关系,其中,3D时空位置编码由两部分组成:2D空间编码和1D时间编码;具体设计为在Stage2、Stage4阶段嵌入局部窗口空间注意力、在Stage6阶段嵌入全局时间注意力。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361000 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励