首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于服务开放平台的动态数据更新方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国标准化研究院

摘要:本发明公开了一种基于服务开放平台的动态数据更新方法及系统,包括获取服务开放平台的实时共享数据和源数据,对所述实时共享数据进行预处理,根据噪声估计对所述实时共享数据进行选择获得重点数据,计算所述重点数据的优化均值偏移,根据所述优化均值偏移对所述重点数据进行分类获得层次数据,根据所述源数据校正所述层次数据获得目标数据,根据所述目标数据构建动态数据更新模型,将待更新实时数据输入所述动态数据更新模型,输出更新结果。该方法不仅可以提高服务开放平台的动态数据更新方法的精度,同时具有较好的可解释性,可以直接应用于基于服务开放平台的动态数据更新系统中。

主权项:1.一种基于服务开放平台的动态数据更新方法,其特征在于,包括以下步骤:获取服务开放平台的实时共享数据和源数据,对所述实时共享数据进行预处理;根据噪声估计对所述实时共享数据进行选择获得重点数据,计算所述重点数据的优化均值偏移;包括:a、根据自适应k近邻方法得到实时共享数据的个性近邻参数,寻找近邻;基于实时共享数据的近邻标签构建实际标签的后验分布,表达式为: 其中第个真实标签为,第b个真实标签的均值为,转置为T,第b个高斯分布的权重为,第个实时共享数据的个性邻近参数为,高斯分布的权重为,真实标签的后验分布为,协方差矩阵的标准差为,高斯系数为;计算噪声估计值: 其中噪声估计值为,;将实时共享数据的标签噪声估计值按降序排列,得到第一数据集;计算第一数据集的最佳选择比例: 其中第一数据集为H,回归模型u的复杂度为,实时共享数据的数量为m,第一数据集的期望函数为,回归模型u在第一数据集的实际经验误差为,第个标签噪声估计值的平方为,选择系数为,选择比例为,目标函数取最小值时的变量函数为,最佳选择比例为;根据最佳选择比例过滤第一数据集得到第二数据集,采用标签噪声估计值对第二数据集进行噪声过滤,得到噪声数据和正常数据;对正常数据进行召回模型训练,采用噪声数据测试模型得到模型误差,将噪声数据按照模型误差升序排序;选择噪声数据中选择比例误差小于0.21的数据与正常数据合并,得到召回数据,采用噪声估计对召回数据进行二次过滤得到重点数据;b、计算所述重点数据的优化均值偏移,表达式为: 其中重点数据为f,第个实际重点数据为,带宽参数为,偏移因子为,优化均值偏移为,重点数据的数量为S,自然常数为e,核密度估计函数为,范数为;根据所述优化均值偏移对所述重点数据进行分类获得层次数据,根据所述源数据校正所述层次数据获得目标数据;包括:采用递归算法根据重点数据创建索引数据集,对索引数据集进行优化均值偏移,表达式为: 其中标准常量为,维度的带宽参数为,索引数据集的数据数量为L,第个索引数据为,索引数据g的优化均值偏移为核密度梯度估计为;给定核密度梯度估计,表达式为: 其中核函数为,重点数据为f,第个实际重点数据为,重点数据的数量为S,重点数据的核密度梯度为;在索引数据集中搜索重点数据的最近邻数据,采用近邻数据构成近邻数据集;将近邻数据集中重点数据的频率计数标志加一,计算更新后的优化均值偏移的索引数据值;计算虚拟的重点数据: 其中第c次迭代第个重点数据为,第c+1次迭代第个重点数据为,重点数据的优化均值偏移值为,遗传因子为;根据更新后的优化均值偏移的取值区间将重点数据进行分类,获得分层数据,不断迭代直到遍历完所有重点数据;根据所述目标数据构建动态数据更新模型,将待更新实时数据输入所述动态数据更新模型,输出更新结果;包括:动态数据更新模型包括随机森林算法、独立成分分析法、时间序列分析算法、动态神经网络算法、遗传算法;随机森林算法将目标数据划分成训练集和测试集;独立成分分析法通过分析训练集的高阶统计相关性,找到相互独立的信息成分隐含,根据信息隐含成分提取数据特征;时间序列分析算法根据数据特征的平稳性检验获取时间序列特性;动态神经网络算法学习时间序列特性的更新规律;遗传算法通过测试集放入动态数据更新模型的误差调整超参数。

全文数据:

权利要求:

百度查询: 中国标准化研究院 一种基于服务开放平台的动态数据更新方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。