恭喜昆明理工大学龙华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜昆明理工大学申请的专利一种基于音素的语种区分性特征的语种识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115019775B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210096847.9,技术领域涉及:G10L15/02;该发明授权一种基于音素的语种区分性特征的语种识别方法是由龙华;苏树盟;邵玉斌;杜庆治;黄张衡;段云;王延凯设计研发完成,并于2022-01-26向国家知识产权局提交的专利申请。
本一种基于音素的语种区分性特征的语种识别方法在说明书摘要公布了:本发明涉及一种基于音素的语种区分性特征的语种识别方法,属于音频信号处理技术领域。本发明先从TIMIT数据集中抽离出音素集,对音素集构建了音素语音学区分性特征,采用音素语音学区分性特征训练并测试音素识别器,输出音频的帧级音素概率向量;再从LibriVox音频数据库获取多语种语料,针对多语种语料对TIMIT数据集中抽离出音素集进行音素扩充,输出语种短时完整语义语音段的帧音素概率特征;最后根据音素识别器输出的不同语种的帧音素概率特征构建语音段音素概率特征,进而构建语音段语种区分性特征。本发明可在经典的二维卷积神经网络中进行语种识别,获得较高识别率的语种识别结果。
本发明授权一种基于音素的语种区分性特征的语种识别方法在权利要求书中公布了:1.一种基于音素的语种区分性特征的语种识别方法,其特征在于: Step1:首先获取LibriVox音频数据,再采用短时谱熵、短时能量,短时过零率参数进行完整语义短时语音段切分; Step2:读入TIMIT数据集,依据TIMIT数据集合中的手动标记信息提取音素集合; Step3:依据音素集合中的音素基音频率信息、共振峰频率信息构造音素区分性特征; Step4:利用GMM模型对音素区分性特征进行训练和测试,构建帧级的音素识别器; Step5:将完整语义短时语音段进行预处理并分帧,再将帧信号输入音素识别器,输出不同语种整语义短时语音段的帧音素概率向量; Step6:在TIMIT音素集基础上,根据不同语种语音帧音素概率的信息熵判断扩充多语种音素集; Step7:先根据语音段帧音素概率向量求语音段音素向量及语音段音素概率向量,再根据语音段音素向量及语音段音素概率向量求语音段的n-gram元法的音素概率向量,最后以语音段的n-gram元法的音素后验概率向量组合作为音素区分性信息,完成语音段的音素语种区分性特征的构造; Step8:先将二维的语音段的音素语种区分性特征转为灰度图,再采用经典的残差神经网络Resnet进行语种识别,最后获得较高识别率的语种识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650093 云南省昆明市五华区学府路253;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。