Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 河海大学叶枫获国家专利权

河海大学叶枫获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉河海大学申请的专利一种基于Flink的多模数据生成器的构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114003476B

龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111231719.2,技术领域涉及:G06F11/34;该发明授权一种基于Flink的多模数据生成器的构建方法是由叶枫;李凌;沈丽群设计研发完成,并于2021-10-22向国家知识产权局提交的专利申请。

一种基于Flink的多模数据生成器的构建方法在说明书摘要公布了:本发明公开了一种基于Flink的多模数据生成器的构建方法,包括如下步骤:1构建多模数据字典;2构建多模数据生成器;3基于ApacheFlink的多模数据生成器配置与部署;4实现多模数据生成器的资源使用状况监控。本发明公开的一种基于Flink的多模数据生成器能够生成包括关系、键值、图、Json、XML多种模型的数据,同时用户可以根据自己的需求来生成所需大小的数据;该多模数据生成器是基于Flink平台实现和部署的,利用了Flink的并行处理和主动内存管理机制来实现其高效性和扩展性,还集成了Prometheus,对其进行更加细粒度的资源利用情况。

本发明授权一种基于Flink的多模数据生成器的构建方法在权利要求书中公布了:1.一种基于Flink的多模数据生成器的构建方法,其特征在于,包括如下步骤: 1构建多模数据字典;从Amazon、LDBC和DBpedia获取多模源数据Customer、Vendor、RegUser、Product、Order、Invoice、Review,数据集源于UniBench模拟的社交商务场景,其中,Customer、Vendor、RegUser是关系型数据类型,表示客户、供应商和注册用户;Product、Order是Json数据类型,表示商品和订单信息;Invoice代表发票信息,是XML格式;Review代表顾客的反馈,是Key-value类型的数据;SocialNetwork表示的是社交网络数据,其数据类型是图数据;对上述数据开展数据预处理,剔除其中的空值数据和错误数据,进一步核对数据对象之间的关联关系,从而构建多模数据字典,构成了多模数据集的种子数据,多模数据字典的数据结构如下表1所列,该数据字典进一步扩展; 表1多模数据字典的数据结构 2构建多模数据生成器;具体包括如下步骤: 21设置多模数据生成器用户参数λ,用户根据需要生成的数据规模调节λ的大小来控制数据生成器生成的数据规模,以GB为计量单位; 22根据前述所构建的多模数据字典,实现Java程序,使用伪随机数据生成算法生成固定大小的各种数据Customer、Vendor、RegUser、Product、Order、Invoice、Review,各种数据的规模与λ成正比关系; 23实现Java程序,基于ApacheFlink的map算子遍历随机生成的Product和Order数据,并将其转化为Json数据格式; 24实现Java程序,基于ApacheFlink的map算子遍历随机生成的Invoice数据,并将其转化为XML数据格式; 25实现Java程序,对随机生成的Customer和RegUser数据,进行多表及多关系查询,基于ApacheFlink的TableSQLAPI生成所需的SocialNetwork图数据; 26编写Java程序实现多种数据存储接口用于数据存储与读取; 3配置与部署基于ApacheFlink的多模数据生成器; 4监控多模数据生成器的资源使用状况。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学,其通讯地址为:210098 江苏省南京市鼓楼区西康路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。