一种基于特征校正的结构化数据新类别识别方法及装置

导航：龙图腾网> 最新专利技术> 一种基于特征校正的结构化数据新类别识别方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江大学

摘要：本发明公开了一种基于特征校正的结构化数据新类别识别方法及装置，包括：获取有标注样本集和无标注样本集，将每一个样本输入表征编码器，得到样本表征；根据神经网络坍缩现象，生成预分配的单纯形等角紧凑结构作为目标化最优分类头；为无标注样本集中的样本生成初步伪标签，对初步伪标签进行细粒度修正，得到硬标签；基于目标化最优分类头和样本标签，对样本表征进行校正；根据校正后的样本表征和对应的标签，进行基于损失大小关系的标签过滤；使用过滤后的标签及其对应的样本进行半监督训练，更新表征编码器参数；所述半监督模型包括训练好的表征编码器和目标化最优分类头，用于新类样本识别。本发明大幅度提升结构化数据新类别识别准确率。

主权项：1.一种基于特征校正的结构化数据新类别识别方法，其特征在于，包括：获取有标注样本集和无标注样本集，将每一个样本输入表征编码器，得到样本表征；所述有标注样本集和无标注样本集中的数据为结构化数据；根据神经网络坍缩现象，生成预分配的单纯形等角紧凑结构作为固定的目标化最优分类头；通过求解最优传输的分配问题为所述无标注样本集中的样本生成初步伪标签，通过辅助分类头对初步伪标签进行细粒度修正，得到硬标签；其中标签对应样本的类别；基于所述目标化最优分类头和样本标签，对所述样本表征进行校正；根据校正后的样本表征和对应的标签，进行基于损失大小关系的标签过滤；使用过滤后的标签及其对应的样本进行半监督训练，更新表征编码器参数；半监督模型包括训练好的表征编码器和目标化最优分类头；所述半监督模型用于新类样本识别；所述根据神经网络坍缩现象，生成预分配的单纯形等角紧凑结构作为固定的目标化最优分类头，包括：根据神经网络坍缩现象，可学习分类头会收敛形成一个单纯形等角紧凑结构E＝[e1,…,eK]∈RP×K，提供一个类内紧凑，类间最大化分离的特征分布：其中，K为是类别总数，IK是单位矩阵，1K是全1向量，U∈RP×K是随机旋转矩阵；其中，P≥K；构建预分配的目标化分类头hetf，其权重为随机初始化的单纯形等角紧凑ETF结构，即为所述目标化最优分类头；所述通过求解最优传输的分配问题为所述无标注样本集中的样本生成初步伪标签，包括：通过基于均分约束的最优传输进行粗粒度分配；具体的，给定当前b个无标注样本，其对应的逻辑输出矩阵为P＝[hetfz1,…,hetfzb]，待分配的初步伪标签矩阵为Q＝[q1,…,qb]∈[0,1]K×b，通过最优传输对Q进行求解，得到初步伪标签；其中H·为熵函数，∈为权重超参数，Tr·为矩阵迹函数；所述通过辅助分类头对初步伪标签进行细粒度修正，得到硬标签，包括：使用有标注样本集和无标注样本集训练辅助二分类头haux；根据训练好的辅助二分类头haux生成对应二分类预测yaux,标签1和标签0分别表示该样本被预测为已知类与新颖类，基于该二分类预测yaux对初步伪标签Q进行标签精炼，保留一致分量，舍弃不一致分量；根据精炼后的伪标签q分量大小生成硬标签其中，qj是q的第j个分量；所述基于所述目标化最优分类头和样本标签，对所述样本表征进行校正，包括：所述目标化最优分类头hetf，采用基于固定分类器的分类损失替代标准交叉熵损失：其中τ为温度参数，是已知或分配好的样本标签；通过损失Letf，所述样本表征zi逐渐被校正，靠近对齐到对应的目标分配同时远离其他分量，最终形成单纯形等角紧凑结构，最终总的分类损失为：Lcls＝Letf+Lent其中是避免目标化最优分类头hetf过于偏向某一类的正则化熵；p是每一类的平均预测概率值。

全文数据：

权利要求：

百度查询：浙江大学一种基于特征校正的结构化数据新类别识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种猫的补钙剂及其制备方法

下一篇：包层掺稀土增益泵浦的光纤激光器及光纤制备方法

相关技术

一种猫的补钙剂及其制备方法

包层掺稀土增益泵浦的光纤激光器及光纤制备方法

一种防止绝缘层破损漏电的防火分支电缆

继电器粘连检测方法、装置、设备、存储介质及产品

一种改性淀粉基热熔胶及其制备方法

一种船用LNG供气装置性能联调测试系统及测试方法

一种开源代码仓库摘要自动生成方法

同步检测柑橘黄龙病菌亚洲种和柑橘溃疡病菌的双重实时荧光PCR引物探针及试剂盒

一种反渗透膜的制备方法及其在污水处理中的应用

一种确定沉水植物生长状态的方法及其应用

一种高Q值的光子纳米束腔设计方法及介质

一种电子产品防水防尘测试系统以及测试方法

新相关技术

一种新锁定结构的折刀_陈正林_202322521060.5

乳腺癌新辅助化疗术后结果评估系统_南方医科大学南方医院_202210150436.3

一种山茱萸新苷的用途_武汉商学院_202410735012.2

一种参壤芽孢新杆菌及其应用_武汉轻工大学_202410901791.9

一种新三平火箭测发方法_蓝箭航天空间科技股份有限公司_202311600167.7

新燃料干散货船航线燃料加注和航速协同优化方法及系统_上海船舶运输科学研究所有限公司_202410621093.3

一种基于容错同步控制的蔡氏电路系统新判据_南京工业大学_202410740807.2

一种基于NaaS架构的新通信视频流调度系统及方法_联通沃音乐文化有限公司_202410549667.0

一种用于预防新冠病毒的中药组合物_柳玉勤_202410847715.4

一种新的μ型芋螺毒素肽dRK-μ-CnIIIC及其应用_深圳肽盛生物科技有限公司_202410635679.5

数据相关技术

数据发送方法、数据接收方法和装置_富士通株式会社_202280090480.8

数据处理方法_合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)_202410598646.8

数据采集装置_中移动信息技术有限公司_202320302535.9

三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置_松下电器(美国)知识产权公司_202280078761.1

数据访问方法及装置_杭州海亮铭优在线教育科技有限公司_202410771374.7

私有数据交换_雪花公司_202080003969.8

数据存储方法及设备_阿里云计算有限公司_202210106999.2

干旱数据监测处理方法_北京风云气象科技发展有限公司_202410753746.3

一种POI数据与轮廓数据的挂接方法和系统_汉海信息技术(上海)有限公司_202010930866.8

一种数据处理方法、装置和用于数据处理的装置_北京搜狗科技发展有限公司_201810846026.6

化相关技术

尿液稳定化_凯杰有限公司_202410602302.X

智能化点心炉_环球炉业(惠州)有限公司_202323637913.8

一种配电自动化设备电气自动化检测装置_长春工业大学人文信息学院_202410839993.5

一种灌区盐渍化水盐动态数字孪生场景化系统_宁夏回族自治区水利科学研究院_202410751135.5

一种污泥输送机构、污泥干化设备及干化方法_泰普斯(厦门)环保科技有限公司_201911225091.8

激光结构化的有机光伏设备的稳定化_赫里亚泰克有限责任公司_201980082412.5

一种自动化无机玻化微珠保温砂浆生产设备_娄城环保(苏州)有限公司_202410770028.7

具有模块化构造的接线端子和模块化系统_WAGO管理有限责任公司_202280080490.3

数字道路地图的版本化_梅赛德斯-奔驰集团股份公司_202280089690.5

自动化测试装置_深圳市达实智控科技股份有限公司_201811625396.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于特征校正的结构化数据新类别识别方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务