Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜东南大学宗源获国家专利权

恭喜东南大学宗源获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜东南大学申请的专利基于CISF模型的跨库语音情感识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115171662B

龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210748096.4,技术领域涉及:G10L15/02;该发明授权基于CISF模型的跨库语音情感识别方法及装置是由宗源;常洪丽;郑文明;路成;唐传高;赵焱;朱洁设计研发完成,并于2022-06-29向国家知识产权局提交的专利申请。

基于CISF模型的跨库语音情感识别方法及装置在说明书摘要公布了:本发明公开了一种基于CISF模型的跨库语音情感识别方法及装置,方法包括:1获取两个语音情感数据库,分别作为训练数据库和测试数据库:2提取训练数据库和测试数据库中具有相同情感类别标签的语音样本,分别作为源域样本和目标域样本,并提取源域样本和目标域样本的IS09特征作为样本特征;3建立语料库无关显著性特征选择模型4对所述语料库无关显著性特征选择模型进行学习,得到投影矩阵U的最优值5对于待识别语音,提取IS09特征,并采用学习到的投影得到对应的情感类别。本发明识别准确率更高。

本发明授权基于CISF模型的跨库语音情感识别方法及装置在权利要求书中公布了:1.一种基于CISF模型的跨库语音情感识别方法,其特征在于该方法包括:1获取两个语音情感数据库,分别作为训练数据库和测试数据库,其中,训练数据库中包含有若干语音样本和对应的情感类别标签,测试数据库仅包含语音样本:2提取训练数据库和测试数据库中具有相同情感类别标签的语音样本,分别作为源域样本和目标域样本,并提取源域样本和目标域样本的IS09特征作为样本特征;3建立语料库无关显著性特征选择模型,具体为: 式中,U是待学习得到的投影矩阵,用于将语音样本从原始特征空间转换到有区别的、语料库不变的公共子空间;表示源域所有样本的样本特征形成的特征矩阵,d为特征矩阵的维数,ns为源域样本数,表示对应的标签矩阵,表示目标域所有样本的样本特征形成的特征矩阵,表示对应的标签矩阵,nt为目标域样本数,gds和λ是平衡正则项的权衡参数,c为情感类别总数,分别表示源域、目标域中属于第i类情感的语音样本的特征矩阵,分别表示第i类情感语音样本的1*ns和1*nt向量;4对所述语料库无关显著性特征选择模型进行学习,得到投影矩阵U的最优值5对于待识别语音,提取IS09特征,并采用学习到的投影得到对应的情感类别;其中,步骤4具体包括:4-1初始化投影矩阵U;4-2根据投影矩阵U按照采用下式预测所有目标域样本的情感类别标签,然后根据预测的情感类别标签所属的情感类别序号i确定 emo_labelj表示第j个目标域样本的情感类别标签,为的第i项,为第j个目标域样本的样本特征;4-3根据确定的按照下式计算边缘和情感类感知的条件特征分布差距Δi: 4-4根据边缘和情感类感知的条件特征分布差距Δi将语料库无关显著性特征选择模型转化为有约束的优化问题: s.t.P=U式中,L=[Ys,0]和为中间变量,是零矩阵,P为辅助变量,00,…,0c是元素全为0且大小分别与Δ0,…,Δc相同的矩阵, 4-5通过交替最小化变量的拉格朗日函数求解所述优化问题,得到当前次循环的投影矩阵值Uk;4-6判断是否满足∥Uk-Uk-1∥F∈,∈表示预设阈值,Uk-1表示上一次循环的投影矩阵值,k表示迭代次数,若不满足,则以当前的投影矩阵值Uk返回执行步骤4-2,若满足,则将当前的投影矩阵值Uk作为最优值其中,步骤4-5具体包括:4-5-1将所述优化问题转化为拉格朗日函数: 式中,T是乘数矩阵,κ是权衡参数,Tr[]表示求矩阵的迹;4-5-2固定U,T和κ,按照下式更新P,使得P=2ZZT+κI-1κU-T-ZLT 式中,I表示单位矩阵;4-5-3固定P,T和κ,更新U: 之后令其中pi和ti分别是P和T的第i行,并按照从大到小的顺序对λi的元素从新排序,再基于选择的特征的数量ds,计算得到表示第ds+1个λi的值;最后通过以下准则更新U: 如果否则,ui=0;式中,ui表示的U的第i行;4-5-4按照下式更新T和κ:T=T+κP-U,κ=min{ρκ,κmax};式中,ρκ表示更新后的k值,κmax表示最大的κ值;4-5-5检查是否满足∥P-U∥F∈,若否,则返回执行步骤4-5-2,若是,则结束循环,将此时的U值输出;其中,步骤5具体包括:对于待识别语音,提取IS09特征并采用学习到的按照下式投影得到对应的情感类别emo_labelte: 其中,为的第i项。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。