买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海维迈数字科技有限公司;维迈科技股份有限公司
摘要:本发明公开了基于深度学习的数字人交互视频业务实时分析方法及系统,涉及人机交互领域;包括:数据采集模块,其负责采集用户与数字人的交互视频数据,包括用户的语音、手势和面部表情的多模态数据;预处理模块,对采集到的视频数据进行预处理,包括去躁、增强、特征提取、针对语音数据进行语音情感分析、针对手势和面部表情数据进行关键帧提取和特征点标注;深度学习分析模块,建立深度学习模型,利用深度学习模型识别用户的多模态数据。本发明通过采集用户的语音、手势、面部表情的多模数据,进行特征处理后进行多模融合,再进行加权处理后识别意图,从而能直接识别用户意图,解决了局限性问题。
主权项:1.基于深度学习的数字人交互视频业务实时分析系统,其特征在于,包括:数据采集模块,其负责采集用户与数字人的交互视频数据,包括用户的语音、手势和面部表情的多模态数据;预处理模块,对采集到的视频数据进行预处理,包括去躁、增强、特征提取、针对语音数据进行语音情感分析、针对手势和面部表情数据进行关键帧提取和特征点标注;深度学习分析模块,建立深度学习模型,利用深度学习模型识别用户的多模态数据,并通过多模态融合技术将不同模态的信息进行融合,以更全面地理解用户意图;数据库,其针对不同的业务类型,收集并储存多种相互匹配的用户意图以及数字人交互动作信息;交互动作生成模块,根据用户意图,在数据库检索匹配的交互动作,并反馈至前端;实时反馈模块,实时反馈模块接收交互动作生成模块的反馈,向用户展示反馈动作。
全文数据:
权利要求:
百度查询: 上海维迈数字科技有限公司 维迈科技股份有限公司 基于深度学习的数字人交互视频业务实时分析方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。