一种融合时空图注意力网络的多模态人格预测方法和系统

导航：龙图腾网> 最新专利技术> 一种融合时空图注意力网络的多模态人格预测方法和系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京科技大学;青岛市妇女儿童医院(青岛市妇幼保健院、青岛市残疾儿童医疗康复中心、青岛市新生儿疾病筛查中心)

摘要：本发明公开了一种融合时空图注意力网络的多模态人格预测方法和系统，涉及情感计算技术领域，包括：基于卷积神经网络模型，提取目标视频中的场景时空外观特征、人脸时空外观特征和音频特征；基于图注意力网络模型，提取目标视频中的人脸时空几何结构特征；基于预训练语言模型，提取目标视频的文本特征；将场景时空外观特征、人脸时空外观特征、人脸时空几何结构特征、音频特征和文本特征进行特征融合，得到多模态融合特征；基于多模态融合特征和训练好的人格预测模型，对被试者进行人格预测，得到被试者的人格特质分数。本发明缓解了现有技术中存在的对人脸的特征为挖掘不细致、模态间权重分配不合理的技术问题。

主权项：1.一种融合时空图注意力网络的多模态人格预测方法，其特征在于，所述方法包括：基于第一卷积神经网络模型，提取目标视频中的场景时空外观特征；所述目标视频为包括被试者对话的视频；基于第二卷积神经网络模型，提取所述目标视频中的人脸时空外观特征；基于图注意力网络模型，提取所述目标视频中的人脸时空几何结构特征；基于第三卷积神经网络模型，提取所述目标视频的音频特征；基于预训练语言模型，提取所述目标视频的文本特征；将所述场景时空外观特征、所述人脸时空外观特征、所述人脸时空几何结构特征、所述音频特征和所述文本特征进行特征融合，得到多模态融合特征；基于所述多模态融合特征和训练好的人格预测模型，对所述被试者进行人格预测，得到所述被试者的人格特质分数；所述第一卷积神经网络模型为ResNet-18网络和BiGRU网络相结合的卷积神经网络模型，选用ResNet-18网络为CNN骨干，并将其用于提取单帧场景图像特征模型，ResNet-18网络使用在places365场景分类数据集预训练后的权重进行初始化，删除了ResNet-18网络的最后两层，并使用layer3和layer4输出特征，将通过最大池化和平均池化操作获得的第四个特征连接起来，这就产生了描述每个场景帧的1536维场景特征，在此之上，放置了两个BiGRU层，包括dropout层；人脸时空几何结构特征提取依赖图卷积神经网络，从关键点位置特征和局部视觉特征中提取时空图结构特征，对于输入的关键点位置和关键点特征，分别构建两个独立的图注意力网络模型分别提取关于位置的图结构特征以及关于关键点局部外观的图结构特征，构建了一种时空图卷积模块，包含一个空间模块和一个时间模块，其中，一个空间模块又包含1个空间图卷积层、1个批样本归一化层、1个激活层，一个时间模块包含1个卷积层、1个批样本归一化层、1个激活层，关键点位置坐标输入经过2个连续的时空图卷积模块，产生位置时空几何结构特征维度为[b＝1,c＝64,t＝16,n＝20]，此处b表示一批参与训练的样本的大小，c表示图中每个节点产生的特征维度，t表示帧数，n表示每帧人脸中取得20个关键点，关键点外观特征输入经过3个连续的时空图卷积模块，产生外观时空几何结构特征的维度为[b＝1,c＝128,t＝16,n＝20]，将得到的2个时空几何结构特征在通道维度进行结合得到时空几何结构特征[b＝1,c＝192,t＝16,n＝20]，之后创建一个图卷积模块对串联后的时空几何结构特征进一步处理，图卷积模块里包含1个空间模块、1个通道注意力模块、1个时间模块，1个帧间注意力模块，通道注意力模块的引入使提取时空特征对不同的特征有不同的关注，更加关注更重要的特征，帧间注意力模块的引入使模型更加关注更重要的帧，经过图卷积模块处理之后得到的特征维度还是[b＝1,c＝192,t＝16,n＝20]，对此特征在空间维度用求最大值和均值的操作，并把2个特征在特征的维度结合，得到特征为[b＝1,c＝384,t＝16,n＝1]，去除b维度之外的其他为1的维度，得到的人脸时空图几何结构特征为维度为[b＝1,t＝16,c＝384]；所述第三卷积神经网络模型包括VGGish模型；使用基于预训练的Roberta模型的分词器RobertaTokenizer来处理文本；人格预测模型包括多层感知器，将获得的五个特征向量连接成一个特征向量，然后将其作为模块的输入，以评估每个特征分支的贡献，并最小化特征多样性带来的信息冗余，这个模块中加入了残差结构以减轻信息损失，包括两个全连接层，用于计算多通道表示F中每个维度的注意力权重α，α计算为：α＝tanhW2tanhW1F+b+c其中，W1，W2，b和c分别代表两个全连接层的权重矩阵和偏差，使用tanh将注意力权重限制在区间[-1,1]内，然后将得到的注意力向量α与多通道向量F的每个维度进行元素乘法运算，最终融合后的多模态特征向量表示如下：F'＝F×α+F其中，F′是模块的输出，将其输入到MLP中预测五个主要的人格特质分数，以三层感知器作为大五人格预测模型，对于这个预测模型，前两个线性层的激活采用ReLU激活函数，激活后添加一个dropout层，最后一层采用sigmoid激活函数将模型的预测输出映射到[0,1]之间的范围。

全文数据：

权利要求：

百度查询：北京科技大学青岛市妇女儿童医院(青岛市妇幼保健院、青岛市残疾儿童医疗康复中心、青岛市新生儿疾病筛查中心) 一种融合时空图注意力网络的多模态人格预测方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：热回收系统的控制方法、控制装置及计算机可读存储介质

下一篇：订单处理方法、装置、电子设备及存储介质

相关技术

热回收系统的控制方法、控制装置及计算机可读存储介质

订单处理方法、装置、电子设备及存储介质

一种光伏构件

具有均匀氢键合相互作用、同碱基对和异碱基对偏好以及错配辨别力的修饰核碱基

一种纤维假捻纺纱设备及用于复合纤维的纺纱工艺

基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

一种室内立式蔬菜栽培架

基于高强柔性索环连接的混凝土圆形筒状结构与预制筒片

一种铅酸电池自动组装设备及工艺

用于确定泡沫生产的参数的系统和方法

一种高速公路路网级路面养护中长期规划决策方法及系统

一种基于电子元器件控制的防卡死智能锁体

态相关技术

一种基于高效量子剪刀的混合纠缠GHZ态的制备方法_南京邮电大学_202410842905.7

一种预拌流态固化土及其制备方法_武汉华强新型建筑材料有限公司_202411024301.8

一种超临界燃煤机组干湿态转换的方法及系统_浙江浙能中煤舟山煤电有限责任公司_202410941026.X

基于开山土的高强流态固化土制备设备_深圳宏业基岩土科技股份有限公司_202411189591.1

一种游离态PLX5622晶型及其制备方法_上海皓元生物医药科技有限公司_202380033332.7

一种不同价态酸根离子的离子色谱检测方法_浙江大学_202411366231.4

基于子载波偏振态控制的偏振相关损耗缓解方法及系统_上海交通大学_202410959423.X

一种湿态生物发酵蛋白饲料及其制备方法及其应用_山东香驰粮油有限公司_202311282996.5

一种环保型流态土及其基坑肥槽回填方法_广州市建筑科学研究院集团有限公司_202410957135.0

领域知识驱动的可解释神经网络焦炭热态质量预测模型_苏州工业园区蒙纳士科学技术研究院_202411029309.3

网络相关技术

基于受观测网络流的网络变更验证_亚马逊科技公司_202380032153.1

用于多链路设备网络的网络译码_高通股份有限公司_202380029846.5

接入节能网络_联想(北京)有限公司_202280094483.9

网络层异质性_高通股份有限公司_202380030670.5

医疗保健网络_西门子医疗股份公司_202011042329.6

管理电信系统的无线电接入网络中的网络元素_意大利电信股份公司_202380031271.0

基于网络摄像头的网络连接稳定性测试方法及系统_视云(深圳)智能技术有限公司_202410880795.3

软件定义网络控制器网络及其交互方法和存储介质_中国电信股份有限公司_202110339592.X

基于指针网络与遗传算法的安全测试路由节点网络边选择方法_湖南大学_202411236391.7

用于在云网络中传输数据的方法、装置和云网络系统_北京百度网讯科技有限公司_202411230753.1

多模相关技术

一种新型多模键盘_深圳市博仪创新科技有限公司_202420453563.5

一种多标定体模及制作该多标定体模的设备和制作方法_湖南浚朗科技有限公司_202411426641.3

核磁共振多模块检测模体_固安县朝阳生物科技有限公司_201910715550.4

一种望远镜配件一模多穴注塑模具_昆明市腾毅光电科技有限公司_202420262964.2

一种基于深度强化学习的AUV多模移动数据收集方法_山东科技大学_202211553633.6

多模散斑光谱仪、光谱恢复方法及光谱恢复系统_中国地质大学(武汉)_202411040010.8

一种多材质线路识别与图模优化方法和装置_武汉三相电气有限公司_202411461014.3

具有七种混合动力驱动模式的多模混合动力系统_重庆大学_202411284293.0

基于低共模电压SVM控制的链式多电平变换器_广东工业大学_202411099575.3

一种一模多穴的斗齿热熔模具_宁波金球机电铸造有限公司_202420498137.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合时空图注意力网络的多模态人格预测方法和系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务