Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 联通(江西)产业互联网有限公司曾志强获国家专利权

联通(江西)产业互联网有限公司曾志强获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉联通(江西)产业互联网有限公司申请的专利一种数字人智能交互方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121051217B

龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511596664.3,技术领域涉及:G06F16/3329;该发明授权一种数字人智能交互方法、装置及设备是由曾志强;黄巍;王艳;桂贤梁;朱雪平;杨程;朱剑设计研发完成,并于2025-11-04向国家知识产权局提交的专利申请。

一种数字人智能交互方法、装置及设备在说明书摘要公布了:本发明提供了一种数字人智能交互方法、装置及设备,该方法包括:获取目标用户在预设输入界面输入的输入问题信息,所述输入问题信息包括原始语音信息、原始文本信息和原始视觉信息中的至少一项;对所述输入问题信息进行问题类型解析识别,得到问题类型向量根据所述问题类型向量,确定目标用户的意图信息;根据所述意图信息,生成回复内容信息;获取目标用户对所述回复内容信息的反馈状态信息;根据所述反馈状态信息,对所述回复内容信息进行优化,得到优化回复内容信息;根据所述优化回复内容信息,同步口型、表情与肢体动作,生成综合回复内容。该方案可以精准识别图像与文字,提高数字人交互过程中的服务理解能力和回复内容的准确性。

本发明授权一种数字人智能交互方法、装置及设备在权利要求书中公布了:1.一种数字人智能交互方法,其特征在于,应用于数字人智能体,所述方法包括: 获取目标用户在预设输入界面输入的输入问题信息,所述输入问题信息包括原始语音信息、原始文本信息和原始视觉信息中的至少一项; 对所述输入问题信息进行预处理,所述预处理包括语音预处理,文本预处理以及视觉预处理; 对所述输入问题信息进行问题类型解析识别,得到问题类型向量,所述问题类型向量用于区分简单问答需求与多步骤流程需求; 根据所述问题类型向量,确定目标用户的意图信息; 根据所述意图信息,生成回复内容信息;具体包括:根据所述意图信息查询预设知识图谱,得到结构化数据;根据所述结构化数据,生成回复内容信息; 获取目标用户对所述回复内容信息的反馈状态信息; 根据所述反馈状态信息,对所述回复内容信息进行优化,得到优化回复内容信息,具体包括:根据所述反馈状态信息进行策略选择,得到优化指令;根据所述优化指令对所述回复内容信息进行优化,得到优化回复内容信息; 根据所述优化回复内容信息,同步口型、表情与肢体动作,生成综合回复内容; 其中,语音预处理,包括: 通过,对信号实现初步去噪; 根据 以及完成去噪过程,此时获取到原始语音信息; 其中,为输入信号;DWT代表信号的分解过程,分解后得到和;表示信号的低频部分,包含语音的主要能量和轮廓信息;表示信号的高频部分,包含噪声、边缘特征及语音的瞬态信息;表示对高频噪声进行抑制,同时保留语音边缘特征,具体过程为: 其中,表示信号重构函数;表示设定的阈值参数,通过得到;表示信号噪声的标准差,通过得到;M表示信号长度;所述MAD为的中位数绝对偏差,即通过的中位数,计算每个与所述中位数的差异绝对值,再通过差异绝对值的中位数得到MAD;表示缩放因子,此处为常数0.6745;表示经过去噪的信号;表示当前时刻的滤波器系数向量,维度为;表示下一时刻的滤波器系数向量,维度为;表示控制因子,取值为02,越大,收敛越快,但会引发振荡或发散,越小,收敛越慢,但稳定性更高,若考虑效果均衡性,将设置为1;表示从当前时刻n往回看,共N个样本的平方和;i表示索引0到N1;为常数,用来防止分母为0,取值为;表示对经过滤波的信号,即最终的原始语音信息;表示的转置,维度为;表示的转置,维度为;视觉预处理,包括: 根据,拉伸图像整体对比度,使暗部细节和亮部细节更清晰; 根据,处理图像局部过曝或欠曝,从而得到增强对比度后的图像信息; 通过,保留面部与肢体动作的边缘和纹理细节,实现对图像的去噪,获取原始视觉信息,权重通过求得; 其中,为图像信息的输入灰度级;为处理后的输出灰度级;U为变换函数,表示将输入灰度级映射到输出灰度级的映射关系;Q表示图像灰度级的总数;k表示当前正在计算的输入灰度级的索引;表示图像中输入灰度级出现的概率,通过得到,表示图像中灰度级为的像素个数,表示图像的总像素数,E是图像高度,F是图像宽度;表示累积分布函数,表示灰度级≤的所有像素的概率之和;表示图像的输入亮度值;表示图像的输出亮度值;表示图像亮度最大值;表示校正参数,将其设为常数2.2;代表图像f预处理后的信息,即原始视觉信息;f代表图像;b代表f图像中的一个待去噪像素位置;y代表f图像中的另一个像素位置,范围为搜索窗口的范围;表示图像围绕b的定义域,即搜索窗口;表示b和y之间的权重;表示归一化常数,为所有权重的和;表示y位置的噪声像素值;Gb和Gy分别是围绕b和y所提取的图像块;代表两个图像块之间的相似度;h为衰减参数,根据噪声的水平进行设置,噪声越大,将衰减系数设置越大; 其中,对所述输入问题信息进行问题类型解析识别,得到问题类型向量,包括: 对所述输入问题信息进行处理,得到多个特征向量,具体包括: 将所述原始语音信息中的内容信息转录为文本,得到转录文本信息; 提取所述原始语音信息中的声学特征信息,得到声学特征向量,包括:对语音信号进行分帧和加窗处理,得到加窗后的帧;对加窗后的帧进行频谱分析处理,得到表示频域信号的频谱;对频谱进行滤波,压缩语音信号的频率细节,得到滤波后的能量;根据对数能量=ln滤波后的能量,对每个滤波器输出的能量取对数,得到对数能量;对所述对数能量进行离散余弦变换,得到倒谱;取所述倒谱前多个系数,即为声学特征向量; 将所述转录文本信息与所述原始文本信息进行特征提取,得到文本特征向量,包括:在所述转录文本信息与所述原始文本信息中的句子前加入特殊标记,所述特殊标记通过符号进行表示;将加入了特殊标记的句子输入文本训练模型进行处理,得到每个词对应的输出向量即为文本特殊向量; 将所述原始视觉信息进行特征提取,得到视觉特征向量,包括:使用计算机视觉技术对用户的面部图像和肢体动作进行分析,采用基于深度学习的方法,利用卷积神经网络模型,从面部图像中学习表情特征,并从肢体图像中学习肢体特征,以此识别判断用户的面部表情以及肢体动作,共同构成视觉特征向量; 对所述多个特征向量进行问题类型解析识别,得到问题类型向量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人联通(江西)产业互联网有限公司,其通讯地址为:330029 江西省南昌市南昌高新技术产业开发区火炬大街566号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。