买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国移动通信集团广东有限公司;中国移动通信集团有限公司
摘要:本发明提供一种号码识别模型训练方法、号码识别模型训练装置、号码识别方法、号码识别装置及电子设备,该号码识别模型训练方法包括:获取预定时间段内的多个号码的原始数据以及对应的分类标签,原始数据包含业务数据以及信令数据;基于各个号码的原始数据生成与各个号码对应的样本数据特征,样本数据特征包括业务数据特征以及信令数据特征;基于各个号码对应的样本数据特征以及分类标签对号码识别模型进行训练,以使号码识别模型对应的损失函数小于预定阈值。本发明实施例的技术方案,能够训练出高效快捷提取号码特征数据的号码识别模型,并通过该模型提前识别诈骗号码,有效减少电话诈骗。
主权项:1.一种号码识别方法,其特征在于,包括:获取目标号码的原始数据,所述原始数据包含业务数据以及信令数据,所述业务数据包括开户信息和入网渠道;基于所述目标号码的原始数据生成与所述目标号码对应的生产数据特征,所述生产数据特征包括业务数据特征以及信令数据特征;将所述生产数据特征输入号码识别模型进行处理,以得到输出数据,其中,所述号码识别模型是卷积神经网络模型,所述卷积神经网络模型包括第一卷积层、第二卷积层、第三卷积层和第四卷积层,所述第一卷积层的卷积核大小为3x3,所述第二卷积层的卷积核大小为5x5,所述第三卷积层的卷积核大小为矩阵数据列2x矩阵数据行2,所述第四卷积层的卷积核大小为1x1;基于所述输出数据确定所述目标号码的分类的概率,基于所述分类的概率确定与所述目标号码对应的分类标签识别码,将所述分类标签识别码与分类标签库中的分类标签名称进行匹配,以确定所述目标号码对应的分类标签;所述号码识别模型的训练方法包括:获取预定时间段内的多个号码的原始数据以及对应的分类标签;基于所述预定时间段的单位时间对应数据层的数据生成对应数据层的矩阵数据的数据行,所述对应数据层包括业务数据层、信令通话数据层、上网流量数据层和位置数据层;按照所述预定时间段的时序,基于各个单位时间的对应数据层的数据行,生成与各个所述号码的原始数据对应的多层矩阵数据,将所述多层矩阵数据的每层矩阵数据转化为浮点数,并进行归一化处理,得到与各个所述号码的原始数据对应的样本数据特征,其中,所述多层矩阵数据包括业务数据层矩阵、信令通话数据层矩阵、上网流量数据层矩阵以及位置数据层矩阵,所述业务数据层矩阵为第一层,所述业务数据矩阵层的列是预设的固定值,所述样本数据特征包括业务数据特征以及信令数据特征;将所述各个所述号码对应的样本数据特征按照预定比例分为训练数据样本以及测试数据样本,基于所述训练数据样本以及对应的分类标签通过梯度优化器对所述号码识别模型进行训练,基于所述测试数据样本以及对应的分类标签对所述号码识别模型的参数进行调整,以使所述号码识别模型对应的损失函数小于预定阈值,其中,所述预定比例为7:3。
全文数据:
权利要求:
百度查询: 中国移动通信集团广东有限公司 中国移动通信集团有限公司 号码识别模型训练方法、号码识别方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。