买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:金纪科技有限公司
摘要:本申请涉及音频检测技术领域,具体涉及一种非接触式留置谈话虚假音频检测方法及系统。该方法包括:采集待测人员的历史音频数据和待检测音频数据;并将其划分为相对应的局部音频序列,通过其中共振峰的差异获取共振变化度;将音频数据分类,根据类别相似度确定待测音频集合;相同的获取历史音频集合,根据音频集合所对应文本之间的相似性和词语的匹配度语境相似度,并根据语境相似度筛选参考音频数据;根据音频数据对应文本的长度和音频集合的时间特性获取情绪波动值;并结合音频集合之间频谱图差异和相似度构建谈话置信率,根据谈话置信率完成虚假音频检测。本申请提高了虚假音频检测效率与精度。
主权项:1.一种非接触式留置谈话虚假音频检测方法,其特征在于,该方法包括以下步骤:采集待测人员的所有历史音频数据和待检测音频数据;将每个历史音频数据和待检测音频数据划分为相对应的局部音频序列,根据局部音频序列中共振峰之间的差异构建局部音频序列之间的共振变化度;将每个音频数据通过共振变化度聚类分为两类,根据待检测音频数据和历史音频数据的每一类之间的相似度在待检测音频数据中确定待测人员的待测音频集合;以任意一个局部音频序列作为一个聚类中心,以与聚类中心共振变化度最大的局部音频序列作为第二个聚类中心,聚类距离为共振变化度,对于待检测音频数据,分别获取一类音频集合和二类音频集合;获取每个音频集合与历史音频数据的音频集合的类别相似度,类别相似度与音频集合的所有共振变化度呈负相关关系;根据待检测音频数据的音频集合与历史音频数据的所有音频集合的类别相似度的最大值获取待测特征值,基于待测特征值确定待测音频集合;通过获取待测音频集合的方式获取历史音频集合,根据待测音频集合和历史音频集合所对应文本之间的相似性和词语的匹配度获取待测音频集合和历史音频集合的语境相似度,并根据语境相似度筛选参考音频数据;根据参考音频数据和待检测音频数据对应文本的长度以及音频集合的时间特性计算待测人员的情绪波动值,将相邻的属于待测音频集合的局部音频序列语音端点的最小值作为停顿时长,根据所有停顿时长获取停顿特征值,根据待测音频集合的待测文本序列的序列长度和待测音频集合的总时间获取待测人员的语速特征值,根据待检测音频数据的和参考音频数据之间停顿特征值的差异和语速特征值的差异获取情绪波动值;根据参考音频集合和待测音频集合的频谱图中波动的差异以及音频集合的相似度结合情绪波动值构建谈话置信率,根据谈话置信率完成虚假音频检测;所述将每个历史音频数据和待检测音频数据划分为相对应的局部音频序列,根据局部音频序列中共振峰之间的差异构建局部音频序列之间的共振变化度的方法为:对于历史音频数据和待检测音频数据,通过语音分割算法将音频数据分割为局部音频序列;将局部音频序列转换为频谱图,通过频谱图对共振峰进行提取,根据局部音频序列中共振峰之间的频率差异、幅度差异以及局部音频序列中共振峰数量的差异获取局部音频序列之间的共振变化度;所述根据局部音频序列中共振峰之间的频率差异、幅度差异以及局部音频序列中共振峰数量的差异获取局部音频序列之间的共振变化度的方法为:对于任意一个局部音频序列,通过共振峰的频率大小对共振峰集合中的共振峰进行排序获取一个共振峰序列;对于两个共振峰序列,将每个共振峰作为一个数据点,根据共振峰序列对应的时间将两个共振峰序列进行匹配,获取共振峰序列中每个共振峰在另一个共振峰序列中匹配的共振峰,将匹配的共振峰记为匹配峰;对于两个共振峰序列,每个共振峰的频率和幅值构成一个二维点记为共振二维点,计算共振峰与其匹配峰的共振二维点的距离记为差异距离;对于两个共振峰序列,将共振峰和其匹配峰作为一组峰,在一组峰内,将共振峰和匹配峰中最大的频率值记为最大频率;根据所有共振峰和其匹配峰的差异距离以及最大频率获取共振峰距离;共振峰距离与差异距离呈正相关关系,共振峰距离与最大频率呈正相关关系;根据共振峰距离以及局部音频序列之间共振峰的数量差异获取共振变化度;共振变化度与共振峰距离呈正相关关系,共振变化度与共振峰的数量差异呈正相关关系;所述根据待测音频集合和历史音频集合所对应文本之间的相似性和词语的匹配度获取待测音频集合和历史音频集合的语境相似度,并根据语境相似度筛选参考音频数据的方法为:对于历史音频集合和待测音频集合提取文本,获取历史文本序列和待测文本序列,并对待测文本序列获取其关键词序列;计算待测文本序列和历史文本序列的编辑距离,令编辑距离的倒数作为待测文本序列和历史文本序列的相似性;令关键词匹配中匹配的关键词和总关键词数量的比值作为关键词匹配度;根据关键词匹配度和相似性获取语境相似度,语境相似度分别与关键词匹配度和相似性呈正相关关系;将语境相似度归一化后,预设语境判断阈值,将归一化后的语境相似度大于等于语境判断阈值时对应的历史音频集合记为参考音频集合,将参考音频集合对应的历史音频数据记为参考音频数据;所述根据参考音频集合和待测音频集合的频谱图中波动的差异以及音频集合的相似度结合情绪波动值构建谈话置信率的方法为:对于参考音频集合和待测音频集合,将两个音频集合对应的频谱图中,频率相同的数据点的幅值的差值绝对值与对应频率值的乘积作为每个数据点的波动值,将两幅频谱图中所有频率对应的波动值累加获取频谱能量差异度;令待测音频集合与所有参考音频集合中类别相似度与频谱能量差异度的比值的累加和作为待测人员的情绪稳定度;根据情绪稳定度和情绪波动值构建谈话置信率;谈话置信率分别与情绪稳定度和情绪波动值呈正相关关系。
全文数据:
权利要求:
百度查询: 金纪科技有限公司 一种非接触式留置谈话虚假音频检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。