安徽讯飞寰语科技有限公司张钟泽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽讯飞寰语科技有限公司申请的专利副语言标注方法、装置、设备、存储介质和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119724254B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411769408.5,技术领域涉及:G10L25/78;该发明授权副语言标注方法、装置、设备、存储介质和程序产品是由张钟泽;汪宇辉;吴重亮;李永超设计研发完成,并于2024-12-04向国家知识产权局提交的专利申请。
本副语言标注方法、装置、设备、存储介质和程序产品在说明书摘要公布了:本申请公开了一种副语言标注方法、装置、设备、存储介质和程序产品,涉及语音处理技术领域,包括:对目标语音数据进行副语言检测,得到初始检测结果,初始检测结果包括:目标语音数据的每个语音帧是否属于副语言,以及属于副语言时的副语言类别;根据由连续的属于同一副语言类别的语音帧构成的副语言片段的长度,以及副语言片段间的间隔,对初始检测结果进行修正,得到目标检测结果;基于目标检测结果对目标语音数据对应的文本进行副语言标注。基于本申请实现了自动对文本进行副语言标注的目的,提高了副语言标注的效率,降低副语言标注成本。
本发明授权副语言标注方法、装置、设备、存储介质和程序产品在权利要求书中公布了:1.一种副语言标注方法,其特征在于,所述方法包括: 对目标语音数据的各个语音帧进行编码,得到各个语音帧的编码特征; 基于各个语音帧的编码特征对各个语音帧进行分类,得到初始检测结果;所述初始检测结果包括:所述目标语音数据的每个语音帧是否属于副语言,以及属于副语言时的副语言类别;所述基于各个语音帧的编码特征对各个语音帧进行分类,包括:基于各个语音帧的编码特征对各个语音帧进行分类预测,得到每个语音帧的概率分布;每个语音帧的概率分布是该语音帧对应各个类别的概率;所述各个类别包括:非副语言类别以及多个副语言类别;依次根据各个语音帧的概率分布确定各个语音帧的初始类别;其中:如果第一个语音帧的概率分布中的最大概率大于第一阈值,确定所述第一个语音帧的初始类别为所述最大概率对应的类别,否则确定所述第一个语音帧的初始类别为非副语言类别;对于每个非首个语音帧,根据该非首个语音帧的前一语音帧的初始类别,以及该非首个语音帧的概率分布,确定该非首个语音帧的初始类别; 根据副语言片段的长度,以及副语言片段间的间隔,对所述初始检测结果进行修正,得到目标检测结果;其中,连续的属于同一副语言类别的语音帧构成一个副语言片段; 基于所述目标检测结果对所述目标语音数据对应的文本进行副语言标注。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽讯飞寰语科技有限公司,其通讯地址为:安徽省合肥市高新区云飞路66号天源迪科一号楼9楼903;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励