首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向数据多样性增强的图像数据集构建方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学

摘要:本发明公开了一种面向数据多样性增强的图像数据集构建方法和装置,属于数据集构建技术领域,包括:构建包含类别多样性、提示语多样性和生成模型多样性的数据生成模块,指定原始类别和辅助附加类别,生成图像数据;构建包含图像标注和图像处理的数据标注模块,图像数据通过数据标注模块得到标注数据;构建基于图像互相似度的数据筛选模块,在数据筛选模块中计算标注数据与真实数据的互相似度,筛选高于阈值的标注数据作为筛选数据;构建基于拷贝粘贴的数据增强模块,将筛选数据和真实数据进行拷贝粘贴,得到目标图像数据集。本发明通过在数据生成阶段增强多样性,得到兼具多样性、可大规模扩展性且保持对模型性能提高能力的生成图像数据。

主权项:1.一种面向数据多样性增强的图像数据集构建方法,其特征在于,包括以下步骤:步骤1:构建包含类别多样性增强模块、提示语多样性增强模块和生成模型多样性增强模块的数据生成模块,从任意具备类别标注的开源数据集中提取原始类别,并指定辅助附加类别,根据数据生成模块生成原始图像数据集;步骤2:构建包含图像标注模块和图像处理模块的数据标注模块,原始图像数据集通过数据标注模块得到标注数据,所述标注数据作为要生成的目标图像数据集的图像前景,其中,图像处理模块包含标注取反操作与裁切操作;步骤3:构建基于图像互相似度的数据筛选模块,在数据筛选模块中计算标注数据与开源数据集的互相似度,并筛选高于预设阈值的标注数据作为筛选数据;步骤4:构建基于拷贝粘贴的数据增强模块,将筛选数据和开源数据集通过数据增强模块进行拷贝粘贴,得到增强数据,作为目标图像数据集,用于模型训练。

全文数据:

权利要求:

百度查询: 浙江大学 一种面向数据多样性增强的图像数据集构建方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。