厦门大学刘昆宏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利一种基于生成式深度神经网络的促苏醒辅助机器人获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119724493B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411800856.7,技术领域涉及:G16H20/70;该发明授权一种基于生成式深度神经网络的促苏醒辅助机器人是由刘昆宏;赵钰迪;陈俐燕设计研发完成,并于2024-12-09向国家知识产权局提交的专利申请。
本一种基于生成式深度神经网络的促苏醒辅助机器人在说明书摘要公布了:一种基于生成式深度神经网络的促苏醒辅助机器人,涉及认知治疗领域。该机器人可以实现虚拟亲属影像陪护的功能,适用于认知治疗等领域。该机器人利用自然语言处理和深度学习等人工智能技术,辅助改善颅脑损伤患者的意识障碍并促进其苏醒。步骤:一:采集患者亲属的音视频或照片作为条件输入,获取待处理数据;二:对待处理数据进行去噪、目标检测和人脸识别等预处理步骤;三:运用深度学习模型,生成与目标音色相似的促苏醒陪护音频;四:基于生成的音频,使用图像处理算法对原始视频帧中的人物姿态、唇形和表情等进行匹配和调整;五:将合成后的视频帧重新组合为视频序列,输出给用户并保存。提供更便捷、有效的康复辅助。
本发明授权一种基于生成式深度神经网络的促苏醒辅助机器人在权利要求书中公布了:1.一种基于生成式深度神经网络的促苏醒辅助机器人,其特征在于,包括前端模块、后端模块和算法微服务模块; 前端模块用于接收用户上传的目标人物音频、图片、视频数据,并向用户提供功能选项,包括内容修改、预处理; 后端模块包括用于接收待处理数据的存储模块,能够调用相应的算法微服务模块进行处理的功能选择模块,以及脑电信号监测模块; 算法微服务模块包括语音生成子模块、人脸检测子模块、视频生成子模块和输出处理子模块; 语音生成子模块用于根据上传视频对目标文本进行语音合成,提取出目标人物语音信号的频谱、声调、语速语音特征,将文本转换为语音输出; 所述语音生成子模块包括: 一个预处理子模块,基于UVR5模型去除输入音频背景噪声,提高音频的纯净度; 一个音频识别子模块,基于FunASR模型,将输入语音转换为对应文本,使后续的文本处理模块能够基于准确的文本信息进行操作; 一个字符嵌入子模块,将离散的字符数据转化为高维向量表示,使模型能够处理文字信息,捕捉字符之间的语义关系,使得模型在生成语音时更加自然和连贯; 一个编码器子模块,通过Conformer实现,该模块提取字符嵌入的上下文信息,结合卷积和自注意力机制,生成一系列特征向量,能够更好地捕捉长短期依赖; 一个解码器子模块,递归地处理上下文向量和先前的输出,构建出完整的梅尔频谱图,为后续的声码器模块提供输入; 一个声码器子模块,使用基于生成对抗网络的高保真声码器HIFI-GAN,能够生成更自然的音频波形; 一个后处理增强模块,使用SSRN技术来提高音频的清晰度和质量; 人脸检测子模块用于在视频帧中定位和分割出人物区域,并输出相应的坐标和掩码; 视频生成子模块根据合成语音,结合人脸检测子模块输出的人物区域信息,实现人脸表情与口型的精确驱动,将合成的人脸图像无缝融合进输入视频流中,并将合成后的视频帧重新组合为视频序列; 输出处理子模块用于对经过语音合成、人脸检测、视频生成模块处理的视频帧进行整合和优化,使其能够被前端正确播放。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361005 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。