首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种油藏数字孪生数据的分类分级存储方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安电子科技大学

摘要:本发明公开了一种油藏数字孪生数据的分类分级存储方法。涉及油气资源管理数据处理领域,用以提高数据访问效率,同时降低数据管理成本。本发明将油藏数字孪生数据根据初始化的数据字典分别映射到对应的类别,若映射为空,则使用基于决策树的自适应规则更新所述数据字典再行映射;然后将分类好的油藏数字孪生数据使用基于微聚类的冷热数据分级方法进行热度分级,得到对应的热度评分;根据热度评分将油藏数字孪生数据标记为冷数据或热数据;最后将冷数据和热数据分别进行存储。本发明数据分类速度快、分类可靠,能提高对冷热数据动态分级与当下用户需求之间的匹配程度,在满足高效访问数据的情况下,降低了数据存储成本。

主权项:1.一种油藏数字孪生数据的分类分级存储方法,其特征在于,包括:S1、将油藏数字孪生数据根据初始化的数据字典分别映射到对应的类别,若油藏数字孪生数据在当前数据字典中映射为空,则使用基于决策树的自适应规则更新所述数据字典,再将该油藏数字孪生数据根据更新的数据字典映射到对应的类别;所述若油藏数字孪生数据在当前数据字典中映射为空,则使用基于决策树的自适应规则更新所述数据字典,包括:S11、抽取油藏数字孪生数据的多类特征;S12、分别计算每类特征的信息增益和基尼不纯度,其中:信息增益表示为: ,其中,表示特征对油藏数字孪生数据集合的信息增益,是数据集合的熵,表示子集中的样本数量,表示数据集合中的样本数量,是在特征的一个特征值下数据集合的子集,表示特征的特征值集合,为子集的熵;基尼不纯度表示为: , ,其中,表示数据集合的基尼不纯度,表示特征的基尼不纯度,表示子集的基尼不纯度,表示第种类别在数据集合中的相对频率,表示类别的数量;S13、根据信息增益计算每类特征的时效性加权信息增益: ,其中,表示特征的时效性加权信息增益,为调整系数,为最后更新时间的时间衰减函数;S14、基于各类特征的时效性加权信息增益和基尼不纯度,筛选出用于构建决策树的特征类型;S15、使用筛选出的特征类型递归构造决策树并进行剪枝;S16、使用已分类的油藏数字孪生数据及其分类类别训练该决策树;S17、将映射为空的油藏数字孪生数据输入决策树,并与决策树输出的分类类别进行关联,更新到所述数据字典中;S2、将分类好的油藏数字孪生数据使用基于微聚类的冷热数据分级方法进行热度分级,得到对应的热度评分;根据热度评分将油藏数字孪生数据标记为冷数据或热数据;所述将分类好的油藏数字孪生数据使用基于微聚类的冷热数据分级方法进行热度分级,包括:S21、对油藏数字孪生数据进行预处理;S22、提取油藏数字孪生数据中的关键特征;S23、基于提取的关键特征,根据设定的聚类参数对油藏数字孪生数据进行聚类;S24、根据访问频率和访问时间分别计算每一簇类的热度评分,实现热度分级: ,其中,表示第个簇类的热度评分,为求平均函数,表示当前时间,表示该簇类中的每一条油藏数字孪生数据的最近访问时间,表示该簇类的平均访问频率,为权重系数;S3、将冷数据和热数据分别进行存储。

全文数据:

权利要求:

百度查询: 西安电子科技大学 一种油藏数字孪生数据的分类分级存储方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。