基于文本质量感知的视频描述方法与系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：江西财经大学

摘要：本发明提出一种基于文本质量感知的视频描述方法与系统，该方法首先对同一视频标注的所有文本描述生成伪真值标签，通过设计文本‑标签一致性评估方法和文本‑视频相似性评估方法形成描述文本标注质量的向量表示；然后获取包含批量视频的描述质量矩阵，以确保存在准确的最全面的标签与最不相关的标签，并且通过归一化，将所有评估指标对应的质量值映射到相同尺度，加快模型的训练；最后以归一化后的质量向量作为辅助信号，与视频的特征编码拼接后形成标注质量感知的视频特征表达。通过描述质量感知描述解码，令模型能够生成与质量一致的描述。本发明通过全面地评估描述的质量以及文本质量感知描述解码，有效地从噪声数据中学习。

主权项：1.一种基于文本质量感知的视频描述方法，其特征在于，所述方法包括如下步骤：步骤1、选取同一视频标注的所有文本描述，共同构成评估描述质量的伪真值标签；步骤2、基于文本-标签一致性，选取语言评估指标ROUGH、CIDEr和预训练的BERT作为质量评估指标，利用同一视频标注的所有文本描述和伪真值标签评估描述文本标注的质量，以生成第一描述文本标注质量；步骤3、基于文本-视频相似性，选取预训练的CLIP作为质量评估指标，利用同一视频标注的所有文本描述和视频来评估描述文本标注的质量，以生成第二描述文本标注质量；步骤4、将每个文本描述对应的第一描述文本标注质量和第二描述文本标注质量进行拼接，形成描述文本标注质量向量集合；步骤5、获取若干视频的描述文本标注质量向量集合，再进行拼接操作，得到描述质量矩阵；针对每个质量评估指标，将描述质量矩阵中的每个描述文本标注质量向量在对应质量评估指标中的质量值组成质量向量，再进行最小最大归一化处理，得到归一化后的质量向量；步骤6、将归一化的质量向量嵌入为质量特征，利用视觉编码器获取视频的特征编码，将质量特征作为质量辅助信号与特征编码一并送入由多层Transformer模块组成的解码器中，通过自回归的方式，利用质量辅助信号辅助逐步生成描述；在所述步骤2中，基于文本-标签一致性，选取语言评估指标ROUGH、CIDEr和预训练的BERT作为质量评估指标，利用同一视频标注的所有文本描述和伪真值标签评估描述文本标注的质量，以生成第一描述文本标注质量的方法具体包括如下步骤：选用语言评价指标ROUGH和CIDEr当作质量评估指标，通过计算文本描述与伪真值标签的语义一致性来量化标题的质量，以生成描述文本标注质量，其中，分别表示视频标注的第i个描述文本通过ROUGH和CIDEr质量评估指标得到的质量值，对应的过程存在如下关系式：；其中，表示ROUGH，CIDEr的质量评估操作，表示文本描述在第j个质量评估指标计算的描述质量值；选用预训练的BERT当作质量评估指标，首先利用BERT的文本嵌入层分别获取文本描述的文本特征和伪真值标签的文本特征；其中，，，表示文本描述经过BERT得到分词的长度，表示分词的维度，表示实数集，分别表示伪真值标签中第1、2和I个文本描述生成的文本特征；对于分别生成的文本特征和进行全局平均池化操作得到均值向量和，其中，，，分别表示伪真值标签中第1、2和I个文本描述生成的均值向量；对文本特征和分别计算方差得到方差向量和；利用方差向量和创建对角矩阵得到对角协方差矩阵和；其中，，，分别表示伪真值标签中第1、2和I个文本描述生成的方差向量；，，分别表示伪真值标签中第1、2和I个文本描述生成的对角协方差矩阵；利用得到的均值向量和，对角协方差矩阵和，将文本描述和伪真值标签表示为高斯分布和，对应的过程存在如下关系式：；其中，，分别表示伪真值标签中第1、2和I个文本描述表示的高斯分布，表示正态分布；基于高斯分布的表现形式，计算高斯分布与高斯分布中每个元素之间的Bhattacharyya距离，生成文本描述与伪真值标签的距离向量，对应的过程存在如下关系式：；；其中，表示行列式操作，表示转置操作，表示求逆操作，表示文本描述与伪真值标签的距离向量，，，分别表示文本描述与伪真值标签中第1、2和I个文本描述计算的Bhattacharyya距离值；通过对生成的距离向量计算均值，得到描述文本标注的质量，描述文本标注质量和描述文本标注的质量构成第一描述文本标注质量；在所述步骤3中，基于文本-视频相似性，选取预训练的CLIP作为质量评估指标，利用同一视频标注的所有文本描述和视频来评估描述文本标注的质量，以生成第二描述文本标注质量的方法具体包括如下步骤：从视频中均匀采样F帧，采用预训练的CLIP的视觉编码器提取每帧的视觉特征并拼接得到视频特征；其中，，分别表示视频采样的第1，2和F帧的视觉特征；对视频特征中所有帧进行均值池化处理并归一化得到全局视频特征，对应的过程存在如下关系式：；其中，表示归一化操作，表示全局视频特征，，表示特征维度；对描述文本采用预训练的CLIP的文本编码器提取描述文本的全局文本特征，其中，；通过计算全局视频特征和全局文本特征的相似性，作为描述文本标注的质量，对应的过程存在如下关系式：；其中，表示转置操作，表示第二描述文本标注的质量。

全文数据：

权利要求：

百度查询：江西财经大学基于文本质量感知的视频描述方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种稠油工况螺杆泵控制系统

下一篇：绿色重楼病虫害防治方法

相关技术

一种稠油工况螺杆泵控制系统

绿色重楼病虫害防治方法

化合物、有机电致发光元件用材料、有机电致发光元件和电子设备

一种沙门氏菌预富集培养基及其制备方法和在即食调味品中的应用

一种矿山采空区顶板离层测量装置及其测量方法

一种高线吐丝管安装精确定位装置

一种用于实现低速清扫车自动行驶系统的方法

光检测装置

一种电网高影响天气特征与模式识别方法及系统

一种低硬度彩色天然橡胶材料及其制备方法

电信网元实时处理方法、装置、设备、介质及程序产品

情感分类模型训练方法、系统、情感分类方法及系统

感知相关技术

感知方法及装置_北京小米移动软件有限公司_202380008595.2

通信感知方法和装置、基站控制方法_中国电信股份有限公司技术创新中心_202411271515.5

基于舰船实例分割的港口全景感知系统_北京航空航天大学_202210194201.4

一种感知结果处理方法及装置_华为技术有限公司_202010924156.4

一种老年感知测试系统及测试方法_浙江大学_202411045499.8

用户感知速率确定方法、装置及存储介质_中国移动通信集团江苏有限公司_202110690948.4

基于跨网融合的路侧感知共享系统_重庆邮电大学_202410943001.3

用于感知检测的方法、设备及存储介质_北京三星通信技术研究有限公司_202310546172.8

用于感知上有意义的空间内容合成的方法和系统_杜比实验室特许公司_202380031349.9

一种皮肤痛觉感知测量用叩诊设备_滨州医学院烟台附属医院_202411058824.4

描述相关技术

一种低渗透油气藏的勘测和描述方法、设备及介质_德仕能源科技集团股份有限公司_202411442183.2

一种描述植物卷须生长形态的有限元仿真方法_天津理工大学_202410979171.7

一种基于密度诱导支持向量数据描述的故障诊断方法_常熟理工学院_202411017400.3

基于文本质量感知的视频描述方法与系统_江西财经大学_202411219146.5

基于自然语言描述表格的检索增强生成方法_上海电力设计院有限公司_202410943600.5

文件描述符泄漏定位方法、装置、介质及设备_北京罗克维尔斯科技有限公司_202310544757.6

大语言模型驱动的航空发动机控制软件需求描述规范智能检查方法_南京航空航天大学_202411098501.8

流体运动特征描述方法、装置以及介质_中国电信股份有限公司_202110075448.X

基于特征描述符的室内三维重建方法_北京大希科技有限公司_202410374468.0

物业服务对象结构设计与状态描述模型、建立方法及应用_深圳市金地物业管理有限公司_202410898711.9

视频相关技术

视频生成系统以及视频生成方法_瑞龙诺赋(上海)医疗科技有限公司_202310547202.7

视频的分析处理装置及视频编解码系统_镕铭微电子(济南)有限公司_202311837103.9

视频分析方法及系统_株式会社日立制作所_202310547173.4

视频处理方法及装置、体育视频处理方法及装置_阿里巴巴(中国)有限公司_202410808909.3

基于双处理装置的音视频录播系统和音视频录播设备_安徽卓智教育科技有限责任公司_202420571443.5

基于单目视频重演的数字人视频生成方法与系统_浙江大学_202410856057.5

基于视频超分辨率的可伸缩视频编解码方法、设备和介质_重庆邮电大学_202410981814.1

一种基于视频问答的短视频标注方法_北京官匠空间科技有限公司_202411038142.7

视频输出设备、视频输出方法、存储介质和程序产品_佳能株式会社_202410600939.5

视频解码方法和设备、以及视频编码方法和设备_三星电子株式会社_201980055900.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于文本质量感知的视频描述方法与系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务