南宁中平电子衡器股份有限公司李朝忠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南宁中平电子衡器股份有限公司申请的专利一种远程监督数据集去噪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113962325B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111321515.8,技术领域涉及:G06F18/10;该发明授权一种远程监督数据集去噪方法是由李朝忠;梁献兰;蒙彦利;覃晓;何国对设计研发完成,并于2021-11-09向国家知识产权局提交的专利申请。
本一种远程监督数据集去噪方法在说明书摘要公布了:本发明公开了一种远程监督数据集去噪方法,首先,将DS数据集按数据是否有标签,分为正样例集TD和负样例集FD,然后通过基于模式的数据抽取算法抽取TD中高质量的正样例集CTD,利用CTD和FD,训练一个二分类模型Filter‑Net,该模型能够从FD中准确识别高质量负样例集CFD。最后,将高质量负样例集CFD,与正样例集TD一起,共同作为去燥模型RL的训练数据集,获得更高质量的正确标注的样本集。本发明从充分利用DS数据集错误标注的数据出发,提出从DS数据集中抽取高质量正样例、负样例数据的方法,并将高质量正样例和负样例数据用于去燥模型的训练,从而提高去燥模型的准确率,达到有效去燥的目的。
本发明授权一种远程监督数据集去噪方法在权利要求书中公布了:1.一种远程监督数据集去噪方法,其特征在于,包括如下步骤: S1、获取远程监督数据集并将所获取的数据按照是否有标签分为正样本集和假负样本集,具体而言,若数据集中“A”和“B”两个实体句子有关系,且关系为“C”,则(A,B)这一对实体句子的标签即为“C”,若实体句子对间没有关系,则标签为“none”; S2、利用基于模式的数据抽取方法提取步骤S1得到的正样本集中的数据,得到高质量正样本数据,具体而言包括如下步骤: S21、任意选择正样本集中两个实体句子之间所包含的模式词; S22、判断步骤S21选择的词是否在模式pattern中,若不在则将其并入模式集合M中,若是,则模式集合M计数加1; S23、重复步骤S21-S22直至所有的句子处理完毕,对模式集合M中的模式词判定其计数是否大于设定阈值,若是则所选择的模式词为高频模式,对应选择的正样本数据为高质量正样本数据; S3、利用步骤S2提取的高质量正样本数据集和步骤S1获取的假负样本集中的数据共同作为高质量负样本筛选网络的训练数据进行训练得到高质量负样本集; S4、将步骤S3中识别出的高质量负样本集和步骤S1得到的正样本集数据共同作为去噪模型的训练数据集并进行去噪模型训练,得到正确标注的正样本数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南宁中平电子衡器股份有限公司,其通讯地址为:530007 广西壮族自治区南宁市石埠路38号石埠实业有限责任公司三分场内;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。