华南理工大学黄子晗获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种基于思维链的多模态协同数字人交互方法及相关设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120525042B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510424633.3,技术领域涉及:G06N5/04;该发明授权一种基于思维链的多模态协同数字人交互方法及相关设备是由黄子晗;邢晓芬设计研发完成,并于2025-04-07向国家知识产权局提交的专利申请。
本一种基于思维链的多模态协同数字人交互方法及相关设备在说明书摘要公布了:本发明公开了一种基于思维链的多模态协同数字人交互方法及相关设备,其中方法通过多模态感知模块接收用户输入的语言、动作及文本信号,结合历史对话场景生成思维链驱动的多模态思维链,所述思维链动态绑定语音、动作及表情的时序节点并定义其语义关联;通过实时协同校验机制验证多模态输出的情感一致性、时序连贯性及意图匹配度,触发思维链局部回溯与动态修正;最终驱动数字人按优化后的思维链输出协同化的语音、动作及表情。本发明采用大语言模型生成多模态交互思维链,通过时序化绑定与实时校验机制,实现数字人输出的语义深度协同与动态适应性,解决传统技术中多模态割裂、意图匹配偏差及响应僵化问题,显著提升交互拟真度与场景鲁棒性。
本发明授权一种基于思维链的多模态协同数字人交互方法及相关设备在权利要求书中公布了:1.一种基于思维链的多模态协同数字人交互方法,其特征在于,包括以下步骤: 接收并整合用户输入的语音信息、动作信息以及文本信息,结合历史对话场景,解析用户显性需求与隐性情感; 基于用户意图及历史上下文,生成可解释的思维链,定义多模态输出的生成规则与触发条件,明确交互步骤及其关联的多模态输出要求; 根据思维链同步生成数字人动作、语音及文本内容,确保跨模态语义一致性; 将生成内容拆解为语义单元,与原始意图标签进行关键词匹配,执行用户意图匹配性校验; 驱动数字人执行校验通过的内容,并实时响应用户后续输入以更新交互流程; 所述根据思维链同步生成数字人动作、语音及文本内容,包括: 根据思维链节点语义标签同步生成文本回复与数字人动作描述;从思维链中提取核心信息,生成自然语言回复,并标注语义焦点;调用预训练动作生成模型,输入思维链的语义标签及环境参数,输出标准化动作脚本的动作描述。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510641 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励