Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国科学院信息工程研究所周玉灿获国家专利权

恭喜中国科学院信息工程研究所周玉灿获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国科学院信息工程研究所申请的专利一种隐式语义数据增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114219017B

龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111459333.7,技术领域涉及:G06F18/214;该发明授权一种隐式语义数据增强方法是由周玉灿;陈晓华;吴大衍;李波;王伟平设计研发完成,并于2021-12-02向国家知识产权局提交的专利申请。

一种隐式语义数据增强方法在说明书摘要公布了:本发明公开了一种隐式语义数据增强方法。本发明第一阶段利用原始数据训练特征提取器和分类器,然后利用分类器构建知识图谱,并基于提取的特征计算每个类别的类中心和协方差矩阵;第二阶段利用构建的知识图谱识别出尾部类别的相似类别,然后将相似类别的特征变换方向迁移到每个尾部样本上进行特征变化。通过挖掘类别之间的相关关系,极大地丰富了尾部类别多样性。最后,对每个样本沿着迁移的协方差矩阵进行变化方向的无限次高斯分布采样可以获得无穷样本,通过优化无限样本损失函数的上界,得到一个新的基于推理的隐式语义数据增强损失进行模型训练。

本发明授权一种隐式语义数据增强方法在权利要求书中公布了:1.一种隐式语义数据增强方法,其步骤包括:1对于一长尾分布的数据集,使用所述数据集中的样本训练神经网络模型,得到一特征提取器F和分类器H;所述数据集包括训练图像、验证图像和测试图像;2特征提取器F对所述数据集中的样本进行特征提取,利用提取的特征计算每个样本类别的协方差矩阵和类均值,其中协方差矩阵表示每个类别所有特征的语义变换方向,类均值代表了每个类别的特征向量;3利用分类器H对所述数据集中的样本进行分类,基于分类结果构造知识图谱用来存储任意两个类别的相似性;构造所述知识图谱的方法为:使用所述分类器H对所述数据集中的样本进行分类,得到每一样本的分类预测结果Hfi,然后根据Hfi和对应样本的真实标签构建知识图谱V,ε;其中,V是类别结点,矩阵ε中每个元素εij表示类别li中被预测成lj的样本在类别为li的所有样本中的占比;4利用特征提取器F对所述数据集中的尾部样本进行特征提取,获得尾部样本的语义特征;利用尾部样本类别的协方差矩阵中的语义变换对该尾部样本进行增强;5使用所述知识图谱中定义的相似类别的协方差矩阵对增强后的尾部样本类别的语义变化方向进行扩充,得到更新后的协方差矩阵;6使用与尾部样本类别相似的类别的类均值对步骤4所得尾部样本的语义特征进行补充,得到增强后的样本特征;7利用步骤6所得增强后的样本特征和步骤5所得尾部样本更新后的协方差矩阵,为对应尾部样本建立高斯分布,从所述高斯分布中采样出具有无限语义转换的样本以实现对所述尾部样本的无限增强。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院信息工程研究所,其通讯地址为:100093 北京市海淀区闵庄路甲89号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。