买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:空地互联网络科技股份有限公司
摘要:本发明提供了一种风险数据识别方法及系统;其中,所述方法包括:S10,响应于服务接通信号,持续监测接通过程中的交互数据;S20,对所述交互数据进行语义识别以提取出交互内容序列;S30,对所述交互内容序列进行第一计算,若第一计算的第一结果满足第一条件,则转S40,否则转S10;S40,对所述交互内容序列进行第二计算,若所述第二计算的第二结果满足第二条件,则输出所述交互数据存在风险的提示信息,否则转S10;本发明的方案设计了对风险数据的两步分析法,既保证了风险数据识别的低遗漏率,也降低了非必要识别的处理量,提高了识别效率。
主权项:1.一种风险数据识别方法,其特征在于,包括如下步骤:S10,响应于服务接通信号,持续监测接通过程中的交互数据;S20,对所述交互数据进行语义识别以提取出交互内容序列;S30,对所述交互内容序列进行第一计算,若第一计算的第一结果满足第一条件,则转S40,否则转S10;S40,对所述交互内容序列进行第二计算,若所述第二计算的第二结果满足第二条件,则输出所述交互数据存在风险的提示信息,否则转S10;步骤S20中,所述对所述交互数据进行语义识别以提取出交互内容序列,包括:将所述交互数据转化为标准文本数据,对所述标准文本数据进行分割处理以获得文本矩阵,所述文本矩阵中包括若干词汇;将所述文本矩阵与各主题项目进行匹配计算,以得出目标主题项目矩阵;将所述文本矩阵与所述目标主题项目矩阵作为所述交互内容序列;所述将所述文本矩阵与各主题项目进行匹配计算,以得出目标主题项目矩阵,包括:分别计算所述文本矩阵中各词汇与所述各主题项目的第一相似度;基于各词汇的所述第一相似度计算所述文本矩阵与各主题项目的第二相似度,基于所述第二相似度确定所述文本矩阵匹配的目标主题项目矩阵;所述基于各词汇的所述第一相似度计算所述文本矩阵与各主题项目的第二相似度,包括:基于所述第一相似度和第一阈值将各词汇与各主题项目进行分配;通过下式计算所述文本矩阵与各主题项目的第二相似度: 式中,zi=j代表将所述文本矩阵分配给主题项目j,即Szi=j代表所述文本矩阵与各主题项目的第二相似度,即所述文本矩阵分配给所述主题项目j的概率;nw代表所述文本矩阵中分配给所述主题项目j的特定词的数量,所述特定词是各所述主题项目分别预先设置的,用于描述主题项目的核心内涵的词汇,δ代表所述文本矩阵特定词的数量;nd代表所述文本矩阵中所有被分配了主题项目的词汇的数量,k代表所述主题项目的数量;α、β为预设的调节参数,其中,α+β=1,且根据特定词在所述文本矩阵中特定词的等效序号确定得出,等效序号越大,则α越大,而等效序号为各特定词的序号的均值加权均值;步骤S30中,所述对所述交互内容序列进行第一计算,包括:基于所述目标主题项目矩阵提取第一风险序列;基于所述文本矩阵中的被分配了的词汇计算所述文本矩阵与第一风险序列的第三相似度,将所述第三相似度作为第一结果;相应地,所述第一计算的第一结果满足第一条件,具体为:所述第三相似度大于第二阈值;步骤S40中,所述对所述交互内容序列进行第二计算,包括:将所述文本矩阵和所述第一风险序列输入深度学习模型,所述深度学习模型输出第四相似度,将所述第四相似度作为所述第二结果;相应地,所述第二计算的第二结果满足第二条件,具体为:所述第四相似度大于第三阈值。
全文数据:
权利要求:
百度查询: 空地互联网络科技股份有限公司 一种风险数据识别方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。