Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)王鸿鹏获国家专利权

哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)王鸿鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利数据清洗方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117874015B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410054612.2,技术领域涉及:G06F16/215;该发明授权数据清洗方法、装置、电子设备及存储介质是由王鸿鹏;王子颂;宋兴浩设计研发完成,并于2024-01-12向国家知识产权局提交的专利申请。

数据清洗方法、装置、电子设备及存储介质在说明书摘要公布了:本发明提供一种数据清洗方法、装置、电子设备及存储介质。该方法包括:获取目标数据集;根据目标数据集中所包括的类别确定类别约束条件;并将目标数据集划分为多个子数据集;针对任意一个子数据集执行以下步骤:将该子数据集作为待清洗子数据集,其他子数据集作为训练集;基于训练集训练前置视觉语言模型;将待清洗子数据集中的图像和类别约束条件输入到前置视觉语言模型中,得到待清洗子数据集中图像的伪标签;将待清洗子数据集中的图像、标签和伪标签作为三元组输入到后置视觉语言模型,输出待清洗子数据集中图像的判定结果;根据判定结果,对待清洗子数据集进行清洗操作。本发明能够有效识别标注错误,多类别标注不齐,无明显类别主体等问题。

本发明授权数据清洗方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种数据清洗方法,其特征在于,包括: 获取目标数据集;其中,所述目标数据集包括图像以及图像对应的标签; 根据所述目标数据集中所包括的类别确定类别约束条件;并将所述目标数据集划分为多个子数据集;针对任意一个子数据集执行以下步骤: 将该子数据集作为待清洗子数据集,其他子数据集作为训练集;基于所述训练集训练前置视觉语言模型; 将所述待清洗子数据集中的图像和所述类别约束条件输入到所述前置视觉语言模型中,得到所述待清洗子数据集中图像的伪标签; 将所述待清洗子数据集中的图像、标签和伪标签作为三元组输入到后置视觉语言模型,输出所述待清洗子数据集中图像的判定结果;根据所述判定结果,对所述待清洗子数据集进行清洗操作;其中,所述判定结果用于表征所述待清洗子数据集中的图像与其对应的标签和伪标签是否匹配; 其中,所述将所述待清洗子数据集中的图像和所述类别约束条件输入到所述前置视觉语言模型中,得到所述待清洗子数据集中图像的伪标签,包括: 将所述待清洗子数据集中的图像和所述类别约束条件输入到所述前置视觉语言模型中,通过所述前置视觉语言模型提取所述待清洗子数据集中所包括的图像的表征信息,并将所述表征信息作为第一图像特征编码;根据所述第一图像特征编码和所述类别约束条件,得到所述待清洗子数据集中图像的伪标签; 所述将所述待清洗子数据集中的图像、标签和伪标签作为三元组输入到后置视觉语言模型,输出所述待清洗子数据集中图像的判定结果;根据所述判定结果,对所述待清洗子数据集进行清洗操作,包括: 将所述待清洗子数据集中的图像、标签和伪标签作为三元组输入到后置视觉语言模型;使所述后置视觉语言模型基于所述类别约束条件识别输入的图像中所包含的对象所属的类别,根据预设的文本提示判断所述待清洗子数据集中的图像与标签和伪标签之间的匹配关系,并输出所述待清洗子数据集中图像的判定结果; 若所述待清洗子数据集中的图像与标签匹配,与伪标签不匹配,则确定该图像的标签正确; 若所述待清洗子数据集中的图像与标签匹配,与伪标签匹配,则确定该图像存在多个正确标签,并根据该图像对应的标签和伪标签,对该图像重新标注;其中该标签与该伪标签不同; 若所述待清洗子数据集中的图像与标签不匹配,与伪标签匹配,则确定该图像的标签错误,并根据该图像对应的伪标签,对该图像重新标注。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。