首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

音频数据智能质检的方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:陕西拓方信息技术有限公司

摘要:本发明公开了一种音频数据智能质检的方法及系统,涉及音频数据处理技术领域,该方法包括:使用语音识别模块对获取的音频数据进行语音识别以得到音频语音识别结果;使用文本语义理解器对所述音频语音识别结果进行处理以得到音频文本描述词粒度语义编码特征向量的序列;使用基于图式编码机制的语义强化器对所述音频文本描述词粒度语义编码特征向量的序列进行语义特征引导约束强化以得到词间语义关联拓扑引导下词粒度语义编码特征向量的序列;以及基于所述词间语义关联拓扑引导下词粒度语义编码特征向量的序列来确定检测结果,可以自动检测和识别音频数据中的违规内容,以保护用户免受不良信息的影响。

主权项:1.音频数据智能质检的方法,其特征在于,包括:获取音频数据;使用语音识别模块对所述音频数据进行语音识别以得到音频语音识别结果;使用文本语义理解器对所述音频语音识别结果进行处理以得到音频文本描述词粒度语义编码特征向量的序列;其中,对所述音频语音识别结果进行分词处理后通过词嵌入编码器以得到音频文本描述词嵌入编码向量的序列;将所述音频文本描述词嵌入编码向量的序列通过上下文编码器以得到所述音频文本描述词粒度语义编码特征向量的序列;使用基于图式编码机制的语义强化器对所述音频文本描述词粒度语义编码特征向量的序列进行语义特征引导约束强化以得到词间语义关联拓扑引导下词粒度语义编码特征向量的序列;基于所述词间语义关联拓扑引导下词粒度语义编码特征向量的序列来确定检测结果;基于所述词间语义关联拓扑引导下词粒度语义编码特征向量的序列来确定检测结果,包括:将所述词间语义关联拓扑引导下词粒度语义编码特征向量的序列通过基于分类器的违规内容检测器以得到所述检测结果,所述检测结果用于表示是否存在违规内容;将所述词间语义关联拓扑引导下词粒度语义编码特征向量的序列通过基于分类器的违规内容检测器以得到检测结果,包括:将所述词间语义关联拓扑引导下词粒度语义编码特征向量的序列级联为词间语义关联拓扑引导下词粒度联合语义编码特征向量;将所述词间语义关联拓扑引导下词粒度联合语义编码特征向量与所述词间语义关联拓扑引导下词粒度联合语义编码特征向量的长度点乘后,再与所述词间语义关联拓扑引导下词粒度联合语义编码特征向量的一范数进行点减以获得词间语义关联拓扑引导下词粒度全语义联合编码特征向量;将所述词间语义关联拓扑引导下词粒度联合语义编码特征向量与所述词间语义关联拓扑引导下词粒度联合语义编码特征向量的长度的平方根点乘后,再与所述词间语义关联拓扑引导下词粒度联合语义编码特征向量的二范数进行点减以获得词间语义关联拓扑引导下词粒度半语义联合编码特征向量;分别计算所述词间语义关联拓扑引导下词粒度全语义联合编码特征向量和所述词间语义关联拓扑引导下词粒度半语义联合编码特征向量的每个特征值的绝对值的平方根,并以所述平方根计算以2为底的对数值以得到词间语义关联拓扑引导下词粒度全语义联合信息特征向量和词间语义关联拓扑引导下词粒度半语义联合信息特征向量,以作为超参数的加权系数并计算所述词间语义关联拓扑引导下词粒度全语义联合信息特征向量和所述词间语义关联拓扑引导下词粒度半语义联合信息特征向量的加权和,以得到优化的词间语义关联拓扑引导下词粒度联合语义编码特征向量;将所述优化的词间语义关联拓扑引导下词粒度联合语义编码特征向量根据所述词间语义关联拓扑引导下词粒度语义编码特征向量的序列的级联拆分为优化的词间语义关联拓扑引导下词粒度语义编码特征向量的序列;将所述优化的词间语义关联拓扑引导下词粒度语义编码特征向量的序列通过基于分类器的违规内容检测器以得到检测结果。

全文数据:

权利要求:

百度查询: 陕西拓方信息技术有限公司 音频数据智能质检的方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。