一种基于多模态语义交互增强的手语生成系统及方法

导航：龙图腾网> 最新专利技术> 一种基于多模态语义交互增强的手语生成系统及方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：合肥工业大学

摘要：本发明公开了一种基于多模态语义交互增强的手语生成系统及方法，涉及计算机视觉、自然语言处理、深度学习等技术领域。本发明系统由文本编码模块、文本语义增强模块、手语姿态编码模块、跨模态语义交互模块、手语姿态解码模块、帧间运动优化模块和手语视频生成模块组成，可以充分适用于自然语句，并生成对应的手语视频，且保证了所生成手语视频的准确性。本发明解决了自然口语的语句文本生成对应手语视频的问题，通过全局文本语义理解和增强，使得手语视频生成的更加准确。采用跨模态语义交互，使得生成的手语视频更具有一致性。该手语生成系统及方法有效提升了自然口语的语句文本到手语视频的翻译性能。

主权项：1.一种基于多模态语义交互增强的手语生成方法，其特征在于，包括以下步骤：S1，获取语句文本，并对语句文本进行分词，得到各个单词的词向量sn；其中下标n表示第n个单词，n＝1,2,...,N；S2，根据单词的词向量sn得到词特征将单词的位置信息添加到词特征中，得到获得位置信息的词特征将语句文本转换为由构成的长度为N的第一文本序列S3，针对语句文本初始化一个文本标记[Token]，将文本标记[Token]和第一文本序列连接，得到第二文本序列将第二文本序列送入文本编码器中进行编码，得到包含全局语义的文本特征序列s″0:N，s″0:N＝{s″0,s″1,s″2,...,s″n,...,s″N}，其中，s″0表示全局语义，s″1:N＝{s″1,s″2,...,s″n,...,s″N}表示文本特征序列；S4，获取该语句文本对应的手语视频，将手语视频中进行姿态划分，得到各个时间点下的姿态坐标yi；其中下标i表示第i个时间点，i＝1,2,...,T；S5，根据姿态坐标yi得到姿态特征将姿态的时间信息添加到姿态特征中，得到获得时间信息的姿态特征将手语视频转换为由构成的长度为T的姿态序列S6，将步骤S3中得到的全局语义s″0添加至姿态序列中的每一个姿态特征得到包含全局语义的姿态特征进一步得到包含全局语义的姿态特征序列将步骤S3中得到的文本特征序列s″1:N和包含全局语义的姿态特征序列整合成特征对S7，将特征对送入手语姿态解码器中进行解码，得到各个时间点下的解码姿态特征进一步得到解码姿态特征序列S8，将解码姿态特征序列中的每个解码姿态特征映射为姿态坐标Yi，得到姿态坐标序列Y1:T，Y1:T＝{Y1,Y2,...,Yi...,YT}；S9，计算姿态坐标序列Y1:T中相邻帧间的运动误差Lmotion，判断Lmotion＜σ，若是，则执行步骤S10，若否，则返回步骤S3重新进行训练，直至Lmotion＜σ，再执行步骤S10；其中σ为超参数；S10，针对待生成手语视频的语句文本即待处理文本，利用训练后的文本编码器获取待处理文本的全局语义s″0和文本本特征序列s″1:N；将待处理文本的全局语义s″0和文本本特征序列s″1:N输入训练后的手语姿态解码器，得到解码姿态特征序列将所得到的解码姿态特征序列中的每个解码姿态特征映射为姿态坐标Yi，得到姿态坐标序列Y1:T，Y1:T＝{Y1,Y2,...,Yi...,YT}；根据得到的姿态坐标序列Y1:T生成手语视频。

全文数据：

权利要求：

百度查询：合肥工业大学一种基于多模态语义交互增强的手语生成系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：写请求的处理方法、装置、设备和介质

下一篇：制氢装置以及氢发电系统

相关技术

写请求的处理方法、装置、设备和介质

制氢装置以及氢发电系统

一种整车软件管理系统及方法

一种可移动式预装变电站

钢制防火门的焊接装置

一种多自由度解耦的波浪能发电装置及其工作方法

单电池气密流阻测试工装结构

一种鞘管弹簧丝绕制装置

一种模块化储能柜充放电优化控制方法及系统

一种大数据检索方法、装置以及可读存储介质

一种紫外活化过一硫酸盐联用过程去除水中硫酸羟基氯喹的方法

一种基于固体废物的晶须增强免烧多孔陶瓷及其制备方法

增强相关技术

一种双光路增强影像装置及增强影像系统_苏州速迈医学科技股份有限公司_202310219040.4

用于增强现实的系统和方法_奇跃公司_202210650785.1

具有色度增强的眼镜_欧科蕾公司_202280085754.4

增强现实眼镜装置以及显示程序_发那科株式会社_202010669141.8

覆盖增强方法及相关设备_深圳TCL数字技术有限公司_202280089623.3

一种增强复合材料板簧总成_江苏擎弓科技股份有限公司_202323632160.1

利用大模型增强水务知识的方法及装置_红杉天枰科技集团有限公司_202411090594.X

语音增强方法、装置、电子设备及介质_北京大学_202410570722.4

一种增强型防水透气膜_鹤源电子通讯配件(深圳)有限公司_202323662937.9

一种用于增强散热的封装结构_渠梁电子有限公司_202421697536.9

手语相关技术

一种手语识别模型的训练方法、动态手语识别方法及装置_中国工商银行股份有限公司_202410665119.4

手语翻译方法、装置、电子设备及存储介质_中国科学院自动化研究所_202410630648.0

手语的翻译方法和可穿戴设备_维沃移动通信有限公司_202410730444.4

手语识别方法、装置、计算机设备及存储介质_中国科学院深圳先进技术研究院_202410751173.0

一种基于机器视觉的聋哑人手语识别语音输出方法_北京工业大学_202110176544.3

基于全身特征的时空交叉注意力网络手语识别方法及装置_中山大学·深圳_202410565718.9

多功能手语翻译手套_烟台大学_202322753714.7

一种基于知识的多模态特征融合的动态图神经手语翻译方法_厦门大学_202111255321.2

多模态的手语识别方法及装置_深圳疆泰科技有限公司_202410607841.2

一种多功能手语视频实时采集与编辑方法及系统_中国科学院深圳先进技术研究院_202410560146.5

交互相关技术

交互方法、设备及存储介质_成都光合信号科技有限公司_202310237525.6

交互式迭代图像注释_皇家飞利浦有限公司_201980076927.4

交互方法、装置及电子设备_北京字跳网络技术有限公司_202410704498.3

信息交互方法、装置、电子设备及存储介质_网易(杭州)网络有限公司_202410667431.7

一种交互方法、装置、设备、介质、产品_北京有竹居网络技术有限公司_202410738209.1

数控设备的多通道交互方法、装置_银河亮点技术开发(广东)有限公司_202410655408.6

一种虚拟场景交互方法和系统_深圳市星野信息技术有限公司_202410799538.7

探测组件、人机交互装置和移动平台_比亚迪股份有限公司_202323276184.8

多平台交互方法、装置以及电子设备_网易(杭州)网络有限公司_202010701938.1

一种定制家具智能交互设计系统_宁波财经学院_202410681725.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于多模态语义交互增强的手语生成系统及方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务