恭喜山东诚海电子科技有限公司;鲁东大学刘志强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜山东诚海电子科技有限公司;鲁东大学申请的专利基于大语言模型的数字人语音生成系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119314465B 。
龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411813293.5,技术领域涉及:G10L13/08;该发明授权基于大语言模型的数字人语音生成系统是由刘志强;闫志明;邓杰;赵伟;陈海鹏;刘奕辰设计研发完成,并于2024-12-11向国家知识产权局提交的专利申请。
本基于大语言模型的数字人语音生成系统在说明书摘要公布了:本发明涉及数据处理技术领域,具体公开了一种基于大语言模型的数字人语音生成系统,用于解决现有的问题,包括语义分析模块、语音生成模块、多模态同步模块、数据传输模块和用户反馈模块,语义分析模块利用大语言模型对用户输入的语音、文本数据进行语义解析和情感分析,提取语音信息和描述上下文的情感元数据,基于元数据自动派生技术,根据输入内容动态构建适应教育场景的语义结构和情感标签;本发明通过动态时间规整算法和教育知识图谱,精准捕捉语义和情感变化,灵活调整语速与音调,提升数字人语音生成的自然性和教育场景适配性。
本发明授权基于大语言模型的数字人语音生成系统在权利要求书中公布了:1.一种基于大语言模型的数字人语音生成系统,包括语义分析模块、语音生成模块、多模态同步模块、数据传输模块和用户反馈模块,其特征在于,语义分析模块利用大语言模型对用户输入的语音文本数据进行语义解析和情感分析,提取语音信息和描述上下文的情感元数据,基于元数据自动派生技术,根据输入内容动态构建适应教育场景的语义结构和情感标签,语音生成模块基于语义分析模块生成的情感元数据和语义指令,使用语义到语音的多维映射模型,实时生成具有情感表达的语音输出,动态调节语音的音调、语速和音强参数,使得语音符合教育场景中的支持性语调、激励性语调,多模态同步模块实时同步音频、表情和动作,结合时间戳对齐算法和预测模型,在网络波动情况下保持多模态数据一致性,利用分布式文件同步技术优化多用户场景中的多模态数据同步,数据传输模块基于优先级排序技术,对语音和表情动画数据进行优先传输,使用动态压缩和预测补全算法,在传输过程中减少数据量,同时维持虚拟化身的表现,用户反馈模块提交用户交互界面,允许用户实时预览语音和表情生成结果,并对参数进行动态调整,收集用户反馈数据,并通过闭环学习机制优化语音生成和多模态同步逻辑;语义分析模块包括数据预处理子模块、语音识别子模块、语义提取子模块、情感分析子模块、元数据生成子模块、语义和情感对齐子模块、输出生成子模块;语义和情感对齐子模块基于动态时间规整的情感建模算法,识别输入情感的递进及变化模式,动态生成情感强度的时间序列的过程包括:步骤21,数据输入与预处理:从情感分析子模块中获取输入情感特征,输入情感特征包括每个时间步的情感强度构成的情感强度时间序列,以及其对应的时间戳,将输入序列和参考序列进行归一化;步骤22,构造参考情感模式:支持性语调情感模式的情感强度递进阶段包括阶段1、阶段2、阶段3和阶段4,其对应的情感强度变化范围分别为、、、[0.8,1.0],激励性语调情感模式的情感强度递进阶段包括初始阶段、激励阶段、加强激励阶段、高峰阶段,其对应的情感强度变化范围分别为、、、[0.9,1.0],并根据语调类别和其情感强度递进阶段获取动态调整语速和音调;在语义和情感对齐子模块中,根据语调类别和其情感强度递进阶段获取动态调整语速和音调的公式如下:支持性语调中:(1)语速随情感强度的增加呈线性增长趋势,语速调整公式为: 式中:为情感强度,为初始语速,为在支持性语调当前情感强度递进阶段的动态调整语速值,为语速增长系数,根据当前情感强度递进阶段调整,为在支持性语调当前情感强度递进阶段的情感强度下限值;(2)音调随情感强度的增加呈平滑指数增长,音调调整公式为: 式中:为在支持性语调当前情感强度递进阶段的动态调整音调值,、分别为音调的最小值和最大值,为在支持性语调当前情感强度递进阶段的音调增长速率调整因子,根据当前情感强度递进阶段调整;激励性语调中:(1)语速随着情感强度呈二次曲线非线性增长,语速调整公式为: 式中:为在激励性语调当前情感强度递进阶段的动态调整语速值,为初始语速,为在激励性语调中当前情感强度递进阶段的情感强度下限值,为在激励性语调当前情感强度递进阶段的语速增长系数;(2)音调随情感强度呈抛物线型增长,情感高峰时音调达到极值,音调调整公式为: 式中:为在激励性语调当前情感强度递进阶段的动态调整音调值,、分别为音调的最小值和最大值,为在激励性语调当前情感强度递进阶段的情感强度最大值;语义和情感对齐子模块中,经过GPT上下文编码器编码后,得到的上下文表示为,、、、分别为输入词嵌入序列中的单词、、、包含上下文信息的语义表示,利用场景提示对当前语义信息进行上下文对齐,将场景提示嵌入与上下文表示融合并进行提示增强输出,场景提示文本包括支持性语调和激励性语调。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东诚海电子科技有限公司;鲁东大学,其通讯地址为:264006 山东省烟台市开发区长江路300号业达智谷孵化器B栋-6;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。