杭州电子科技大学丽水研究院姚雨辰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学丽水研究院申请的专利一种基于人声分离的音高定位识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118412009B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410673253.9,技术领域涉及:G10L25/90;该发明授权一种基于人声分离的音高定位识别方法是由姚雨辰;颜成钢;郑博仑;潘航佳;徐逸杰;李宗鹏设计研发完成,并于2024-05-28向国家知识产权局提交的专利申请。
本一种基于人声分离的音高定位识别方法在说明书摘要公布了:本发明公开了一种基于人声分离的音高定位识别方法,首先需要根据待识别的演唱视频选择对应的真实的对比文件并进行预处理;然后采用端到端人声分离技术对处理后的数据进行人声分离,得到人声文件;再构建音高定位识别网络,网络由输入层、关系层和输出层组成;最后人声分离得到人声文件输入构建的音高定位识别网络实现音高定位识别。在本发明方法中,通过构建音高定位识别网络,将音高和标准线进行可视化,能够直观地看到人声和经过修音合成的声音的曲线对比,维护观众粉丝的权益,同时相对现有技术提高了泛用性以及准确性。
本发明授权一种基于人声分离的音高定位识别方法在权利要求书中公布了:1.一种基于人声分离的音高定位识别方法,其特征在于,包括以下步骤: 步骤1:准备数据及数据预处理,具体步骤如下: 需要根据待识别的演唱视频选择对应的真实的对比文件;对待识别的演唱视频和对应的真实的对比文件进行预处理,针对其中的音频进行处理,具体包括分帧、加窗、端点检测和降噪操作; 首先端点检测:确定音频信号的起始和结束点; 然后进行分帧操作,将音频信号分割成短小的帧,每帧分割的间隔取值为10-30毫秒; 紧接着加窗:对每一帧应用窗函数,以减少帧边缘的不连续性; 最后降噪:使用降噪算法减少背景噪声,提高语音清晰度; 步骤2:采用端到端人声分离技术对处理后的数据进行人声分离,得到人声文件; 步骤3:构建音高定位识别网络,具体步骤如下: 所述的音高定位识别网络由输入层、关系层和输出层组成; 所述的输入层用于读取人声文件,使用音频特征提取方法得到音频特征,使用音频特征转换方法对得到音频特征进行处理,最终将音频特征转化成能够读取的频域特征; 所述的关系层,定义了音调集合,明确音调的名称,通过设置列表映射来对应音调和频率的关系; 所述的输出层,基于关系层对输入层读取的频域特征,进行处理输出音高视频,其中包含了音调和频率之间的标准线,以及各个音高的频率点; 步骤4:通过构建的音高定位识别网络实现音高定位识别,具体步骤如下: 将步骤2处理得到的人声文件输入构建的音高定位识别网络,通过音高定位识别网络输出音高视频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学丽水研究院,其通讯地址为:323010 浙江省丽水市莲都区南明山街道大沅街与绿源路交叉口东北侧半导体芯片产业园3号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励