北京羽乐创新科技有限公司樊巍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京羽乐创新科技有限公司申请的专利基于机器学习的号码正确性评估方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119939193B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510415152.6,技术领域涉及:G06F18/21;该发明授权基于机器学习的号码正确性评估方法及系统是由樊巍;薛胜光设计研发完成,并于2025-04-03向国家知识产权局提交的专利申请。
本基于机器学习的号码正确性评估方法及系统在说明书摘要公布了:本申请提供一种基于机器学习的号码正确性评估方法及系统。该方法包括:获取号码库中号码与的名称对应样本数据,对样本数据进行筛选和标注处理,得到训练数据集;根据训练数据集,形成规范特征向量集合;利用规范特征向量集合,设定XGBoost模型的初始参数配置;依据特征重要性分析,从规范特征向量集合中筛选关键特征变量,利用筛选后的特征变量,对XGBoost模型进行训练,获得号码正确性评估模型;采用号码正确性评估模型,设定概率阈值;利用号码正确性评估模型对号码库中的号码进行预测,获取预测概率值;将预测概率值与所述设定概率阈值进行比较,输出号码正确性评估结果。本申请显著提高了号码准确性评估的客观性和精准度。
本发明授权基于机器学习的号码正确性评估方法及系统在权利要求书中公布了:1.一种基于机器学习的号码正确性评估方法,其特征在于,包括: 获取号码库中号码与的名称对应样本数据,对所述样本数据进行筛选和标注处理,得到训练数据集; 根据所述训练数据集,形成规范特征向量集合; 利用所述规范特征向量集合,设定XGBoost模型的初始参数配置; 依据特征重要性分析,从规范特征向量集合中筛选关键特征变量,利用筛选后的特征变量,对所述XGBoost模型进行训练,获得号码正确性评估模型; 采用所述号码正确性评估模型,设定概率阈值; 利用所述号码正确性评估模型对所述号码库中的号码进行预测,获取预测概率值; 将所述预测概率值与所述设定概率阈值进行比较,输出号码正确性评估结果; 其中,所述输出号码正确性评估结果之后,还包括: 针对连续型特征和分类型特征,分别构建针对所述号码的特征距离计算矩阵,并设计对应的核函数,得到混合特征处理模型; 利用所述混合特征处理模型,处理所述训练数据集,优化核函数参数,形成高斯过程模型; 从所述号码正确性评估模型的预测结果中,选取预测概率值位于第一预设阈值和第二预设阈值之间的号码样本,并输入所述高斯过程模型,计算预测不确定性指标,以识别需要人工验证的号码样本; 其中,针对连续型特征和分类型特征分别构建针对所述号码的特征距离计算矩阵,包括: 根据所述号码的连续型特征,采用径向基函数核计算特征间距离,形成连续特征距离矩阵,包括:对所述号码的连续型特征进行预处理以消除量纲差异;计算任意两个样本在所述号码的连续型特征上的欧几里德距离,并通过RBF核函数将所述欧几里德距离转换为相似度度量;形成一个n×n的连续特征距离矩阵,其中n为样本数; 根据所述号码的分类型特征,采用Hamming距离核计算特征相异度,形成分类特征距离矩阵,包括:采用独热编码One-HotEncoding将所述号码的分类型特征转换为二进制向量;对于任意两个样本的编码后向量,计算它们的Hamming距离,即不同位的数量;对数据集中的所有样本对计算它们在所述分类型特征上的相似度,形成分类特征距离矩阵; 将所述连续特征距离矩阵与所述分类特征距离矩阵进行加权组合,得到所述混合特征处理模型; 在所述输出号码正确性评估结果之后,还包括: 根据所述号码正确性评估结果,针对号码库管理、数据清洗和推荐系统的应用需求进行场景化处理,输出场景应用结果; 采集所述场景应用结果中的反馈数据和新增号码样本,更新所述号码正确性评估模型,形成优化号码正确性评估模型; 其中,所述更新所述号码正确性评估模型,包括: 根据新增的反馈号码样本,采用恒定学习率的随机梯度下降算法,对所述号码正确性评估模型进行在线参数更新; 输入与号码关联的文本描述信息、行业背景知识和历史验证记录至大型语言模型,提取语义特征,生成非结构化特征向量; 将所述非结构化特征向量与号码的原有特征进行融合,形成融合向量; 利用所述融合向量,更新所述号码正确性评估模型,实现所述号码正确性评估模型的迭代优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京羽乐创新科技有限公司,其通讯地址为:102200 北京市昌平区中关村科技园区昌平园超前路5号4幢2层220B;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。