Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国科学技术大学谢洪涛获国家专利权

中国科学技术大学谢洪涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国科学技术大学申请的专利视频大语言模型安全评估与防御方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120833574B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511338955.2,技术领域涉及:G06V20/40;该发明授权视频大语言模型安全评估与防御方法、系统、设备及介质是由谢洪涛;张勇东;孙一玮;蒋沛奇;刘传彬设计研发完成,并于2025-09-18向国家知识产权局提交的专利申请。

视频大语言模型安全评估与防御方法、系统、设备及介质在说明书摘要公布了:本发明公开了一种视频大语言模型安全评估与防御方法、系统、设备及介质,它们是相对应的方案,方案中:构建的视频风险评估数据集规模大且覆盖全面,层次化和多语言的设计,使数据集具有更强的风险泛化能力,可有效提升模型在实际部署环境中的表现和安全性。双阶段的后训练策略中,第一阶段的方法为上下文感知型风险检测令牌微调方法,可以显著提高了模型在处理复杂输入时对风险信号的感知能力;第二阶段的方法为安全性奖励驱动的动态策略优化方法,可以提高策略训练的稳定性与泛化性。最终获得的优化后的视频大语言模型可以高效实现风险检测与安全响应,特别适用于实时内容审核、在线教育问答、政务视频监控等场景。

本发明授权视频大语言模型安全评估与防御方法、系统、设备及介质在权利要求书中公布了:1.一种视频大语言模型安全评估与防御方法,其特征在于,包括: 构建多类别、多语言与多模态的视频风险评估数据集; 训练视频大语言模型,包括:第一阶段,将视频风险评估数据集中的训练数据输入至视频大语言模型,在视频大语言模型提取的训练数据的原始令牌中插入风险检测令牌,并由视频大语言模型执行基于风险检测令牌的风险识别任务,并计算对应风险识别损失,以及结合风险检测令牌与原始令牌计算上下文一致性损失,结合计算出的所有损失构建第一阶段的训练损失,微调视频大语言模型;第二阶段,将预先分组的训练数据输入至微调后的视频大语言模型,并对微调后的视频大语言模型输出的响应进行打分,利用打分构造响应对之间的相对排序奖励,对微调后的视频大语言模型进行强化训练,获得优化后的视频大语言模型; 将视频与查询文本输入至优化后的视频大语言模型,并在视频大语言模型提取的原始令牌中插入风险检测令牌,在视频大语言模型的推理过程中,基于风险检测令牌感知视频和查文本中是否包含有害元素,输出正常响应或安全响应; 所述将预先分组的训练数据输入至微调后的视频大语言模型,并对微调后的视频大语言模型输出的响应进行打分包括:将微调后的视频大语言模型输出的第组训练数据的响应记为,每一个响应对应第组训练数据中的单个训练数据,为第组训练数据的训练数据总数; 通过打分器赋予安全性偏好分数,表示为: ; 其中,为响应的安全性偏好分数,响应指代中的任意响应;为格式匹配奖励,为内容匹配奖励; 还包括:引入增强机制,计算最终安全性偏好分数,包括:引入置信度调节项,定义为响应的令牌级平均概率熵的反函数,用以表示生成内容的稳定程度;以及引入融合模态互补性的奖励增强机制,在安全性偏好分数的基础上,增加模态互补增益项,则最终安全性偏好分数为: ; 其中,为奖励增益权重系数,为响应的模态互补性奖励,定义为:,、和均为响应中的信息,表示视觉和文本联合输入下对响应的拒绝概率,和分别为仅视觉和文本输入下的拒绝概率,m为互补性阈值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。