首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Triple-GAN的分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湘潭大学

摘要:生成对抗网络GAN在图像生成和半监督学习中显示出极大的发展前景,已发展为三生对抗网络Triple‑GAN。但基于Triple‑GAN的分类方法仍存在两个需要解决的问题:基于KL散度分布构造容易产生梯度消失,出现训练不稳定情况;由于Triple‑GAN手动对样本进行标记标签,会造成手动标记工作量过大及标记不均匀等情况。本发明基于此,拟利用随机森林RandomForests对真实样本进行分类,将叶子节点自动标记标签,同时利用最小二乘生成对抗网络LSGAN的思想构造损失函数,避免梯度消失。

主权项:1.一种基于Triple-GAN的分类方法,该方法包括以下步骤:1获取真实样本;基于Triple-GAN构建三人游戏模型,三人游戏模型由分类器C、生成器G、判别器D组成;将真实样本序列化后输入到分类器C中;判别器D由一个基于二叉决策树预测分析随机森林构成,其中随机森林由m棵树组成,其中:n为真实样本的个数,h为二叉决策树高度,h为大于等于3的整数;形成2h-1*m个叶子节点,将叶子节点作为真实样本标签;2基于Triple-GAN构建分布的分类器C、生成器G、判别器D的目标函数;具体为:将生成器联合分布Pgx,y和分类器联合分布Pcx,y输入到判别器D中,根据生成数据x对应的叶子节点和类标签y的分类器联合分布Pcx,y和分布计算出最优化的目标函数;其中,设定分类器C、生成器G、判别器D目标函数如下: 其中:x表示生成数据,y表示类标签,z表示生成数据x对应的叶子节点;a表示生成器G对生成数据进行编码,a∈{-1,0,1};b表示分类器C对类标签进行编码,b∈{-1,0,1};c表示生成器G对生成数据通过目标函数判别最优的欺骗样本数据,c∈{-1,0,1};此公式中:Ex,y~px,y表示标签对x,y在判别器D中联合分布px,y的期望值;Dx,y表示判别器中标签对x,y的真实样本标签对伪标签的概率;表示标签对x,y在分类器C中联合分布Pcx,y的期望值;表示标签对x,y在生成器G中联合分布Pgx,y的期望值;Gy,z表示生成器中标签对y,z在样本空间的映射,DGy,z,y表示判别器中标签对y,z的生成样本对真实样本的概率;Rc表示平衡函数;α是调节参数,α∈{0,1};3将训练样本输入到生成器G中,形成生成数据;根据目标函数区分真实样本标签和生成数据的差距,当目标函数达到平衡时,将生成数据标记标签,通过标记的标签对图像也就是生成数据进行分类。

全文数据:一种基于TripIe-GAN的分类方法技术领域[0001]本发明涉及一种图像的分类方法,具体涉及基于分布、Triple-GAN三人游戏和随机森林相结合的图像快速分类的方法,属于图像处理领域。背景技术[0002]图像挖掘是数据挖掘中的新兴领域。而图像分类是数据挖掘的基础,面对大量的图像数据,图像分类变得越来越重要。图像分类目前出现了很多分类技术,如决策树、最小距离法、神经网络、模糊分类、支持向量机、k-均值等。GAN模型的提出把图像分类领域提到了一个新的高度,也推动了图像挖掘技术的发展。而基于GAN模型研究,也成为了研究热点。[0003]生成对抗网络GAN在图像生成和半监督学习领域同样显示出极大的发展前景,GAN已成为图像和视觉计算、语音和语言处理、信息安全、棋类比赛,尤其是人工智能领域的热点研究方向。现而今GAN已由双人游戏发展为三人游戏的三生对抗网络(Triple-GAN,Triple-GAN主体包含:分类器C、生成器G、判别器⑶。Triple-GAN能确保分类器和生成器从博弈论的角度实现分类的最优解,并使生成器能够在特定的类中对数据进行采样。[0004]Triple-GAN基于KL散度分布构造的目标损失函数,仍然存在当分布不交叉时,梯度消失的情况。因此,提出利用最小二乘生成对抗网络LSGAN对鉴别器采用最小平方损失函数。实验证明LSGAN的目标函数可以最小化;分布。与常规GAN相比,LSGAN有两个优点:LSGAN能够生成比常规GAN更高质量的图像;LSGAN在学习过程中表现得更加稳定。[0005]但Triple-GAN在应用过程中还是存在以下问题:(1由于利用KL散度分布,对于分布不交叉的情况,容易产生梯度消失,会导致当训练没达到理想结果时候,训练就终止,从而使模型训练不稳定。(2由于手动标记样本会造成标记标签不均匀,存在大量数据标记工作量过大的问题。所以,现有的Triple-GAN图像分类技术存在不足,有必要改进。发明内容[0006]针对以上问题,本文将利用随机森林RandomForests对Triple-GAN的分类算法进行优化,同时利用LSGAN构建基于最小化卡方分布损失函数,拟开展如下工作:[0007]1对分类器进行改进,同时将随机森林融入到分类器中,构建自动标记标签的分类器;[0008]2利用LSGAN损失函数的推理过程,同时结合Triple-GAN构造模型,形成既能继承LSGAN的稳定性,又能传承Triple-GAN的优点。[0009]根据本发明提供的实施方式,提供一种基于Triple-GAN的分类方法。[0010]—种基于Triple-GAN的分类方法,该方法包括以下步骤:[0011]1获取真实样本;基于Triple-GAN构建三人游戏模型,三人游戏模型由分类器C、生成器G、判别器⑶组成;将真实样本序列化后输入到分类器C中;判别器⑶由一个基于二叉决策树预测分析随机森林构成,其中随机森林由m棵树组成,;其中:η为真实样本的个数,h为二叉决策树高度,h为大于等于3的整数;形成2H*m个叶子节点,将叶子节点作为真实样本标签;[0012]2基于Triple-GAN构建;分布的分类器C、生成器G、判别器⑶的目标函数;[0013]3将训练样本输入到生成器G中,形成生成数据;根据目标函数区分真实样本标签和生成数据的差距,当目标函数达到平衡时,将生成数据标记标签,通过标记的标签对图像也就是生成数据进行分类。[0014]在本发明中,步骤1具体为:[0015]101下载minist、svhn、cifarlO中的一种或多种图像,作为真实样本,序列化后,输入到分类器C中;[0016]102三人游戏模型根据随机森林算法构建二叉决策树,将η个真实样本分配到m颗决策树中;[0017]103将m棵决策树的叶子节点标记标签,形成类标签y。[0018]在本发明中,步骤3具体为:[0019]301下载minist、svhn、cifarlO中的一种或多种图像,作为训练样本;[0020]302将训练样本进行序列化形成生成数据X,将生成数据X作为训练集数据输入到生成器G中;[0021]303利用类标签y和生成数据X组成联合分布;[0022]304根据目标函数区分生成数据X和类标签y的差距,当目标函数达到平衡时,将生成数据X标记标签,通过标记的标签对图像也就是生成数据进行分类。[0023]在本发明中,利用类标签y和生成数据X组成联合分布,具体步骤如下:[0024]1生成数据X和类标签y在生成器G中组成生成器联合分布Pgx,y;[0025]2根据随机森林算法构建二叉决策树逻辑对生成器联合分布Pgx,y的进行判断:[0026]当生成器联合分布Pgx,y的内容与决策树一致时,进入下一分支进行判断,直到找到所有生成数据X对应的叶子节点,构建生成数据X对应的叶子节点和类标签y的分类器联合分布Pcx,y;[0027]当生成器联合分布Pgx,y的内容与决策树不一致时,贝Ij进入下一棵森林决策树,迭代步骤2的过程,直到找到所有生成数据X对应的叶子节点。[0028]在本发明中,步骤2具体为:将生成器联合分布PgX,y和分类器联合分布PcX,y输入到判别器⑶中,根据生成数据X对应的叶子节点和类标签y的分类器联合分布PcX,y和::分布计算出最优化的目标函数;其中,设定分类器C、生成器G、判别器⑶目标函数如下:[0030]其中:X表示生成数据,y表示类标签,z表示生成数据X对应的叶子节点;a表示生成器G对生成数据进行编码,ae{-1,〇,1};b表示分类器C对类标签进行编码,be{-1,〇,1};C表示生成器G对生成数据通过目标函数判别最优的欺骗样本数据,Ce{-1,〇,1};此公式中:Ex,y:ix,y:表示标签对x,y在判别器⑶中联合分布Px,y的期望值;Dx,y表示判别器中标签对X,y的真实样本标签对伪标签的概率;表示标签对X,y在分类器C中联合分布Pcx,y的期望值;表示标签对x,y在生成器G中联合分布Pgx,y的期望值;Gy,z表示生成器中标签对y,z在样本空间的映射,D;Gy,z,y表示判别器中标签对y,z的生成样本对真实样本的概率;R。表示平衡函数;α是调节参数,αe{0,1}〇[0031]作为优选,a取值为-I,b取值为I,c取值为0,S卩13-〇=1、13-=2;平衡函数,目标函数满足最小化散度分布;其中:P是判别器的概率联合分布,Pc是分类器的概率联合分布。[0032]在本发明中,所述目标函数达到平衡是指:当判别器达到最优时,即目标函数达到〇.5时,将生成数据X标记标签,形成样本数据,通过插值的方式将样本数据插入到输出数据中,该生成数据X分类完成;[0033]当判别器没有达到最优时,通过平衡函数Rc调节,直到目标函数达到最优,即目标函数达到0.5。[0034]作为优选,该方法还包括:Triple-GAN优化模型不断的训练,直到所有生成数据X都标记标签,将生成数据X形成的样本数据按照类标签y顺序分类输出,即生成数据X分类完成。[0035]作为优选,步骤101中图像数量超过1万张;步骤101中的序列化采用list形式。[0036]作为优选,步骤301中图像数量超过1万张;步骤302中的序列化采用list形式。[0037]在本发明中,森林中的每一棵树中所包含的训练集均采用自助选取法bootstrap、重采样的方式进行分类。并具有以下优点:(1随机森林通过随机样本选择、随机特征选择的特点,使其抗噪声能力表现出色且不易过拟合;(2随机森林可以在不降维的情况下处理高维数据;(3随机森林既能处理连续型又能处理离散型数据集,并且不需要做规范化数据集,适应能力很强;(4随机森林通过在高效的训练过程中生成的相似矩阵来度量样本的相似性。[0038]现有技术中,Triple-GAN基于KL散度分布构造的目标损失函数,仍然存在当分布不交叉时,梯度消失的情况。本发明提出利用最小二乘生成对抗网络LSGAN对鉴别器采用最小平方损失函数。实验证明LSGAN的目标函数可以最小化分布。与常规GAN相比,LSGAN有两个优点:LSGAN能够生成比常规GAN更高质量的图像;LSGAN在学习过程中表现得更加稳定。[0039]在本发明中,随机森林作为预测分类算法,随机森林就是通过随机抽样的方式从历史数据表中生成多张抽样的历史表,对每个抽样的历史表生成一棵决策树。由于每次生成抽样表后数据都会放回到总表中,因此每一棵决策树之间都是独立的没有关联。将多颗决策树组成一个随机森林。当有一条新的数据产生时,让森林里的每一颗决策树分别进行判断,以投票最多的结果作为最终的判断结果。以此来提高正确的概率。随机森林通过跟半监督学习组合,基于以上随机森林的特性,根据如下构建:[0040]首先,基于Triple-GAN构建一个三人游戏模型,三人游戏分别由分类器、判别器、鉴别器,其中生成器由一个基于二叉决策树预测分析随机森林构成,其中随机森林由m棵树组成1其中η总的真实样本数,h为二叉决策树高度),形成2h_1*m个叶子节点,将,真实样本叶子节点样本标记标签。新形成的分类器,迭代生成器生成的数据,对生成器数据,随机森林决策预测数据,将生成器数据,找到最相近的叶子节点,给生成器生成的数据标记标签,输入到判别器中。[0041]然后,构建基于分布分类器C、生成器G、判别器⑶损失函数。而分类器C、生成器G、判别器⑶跟Triple-GAN主要区别是:Triple-GAN损失函数基于KL散度分布,KL散度分布对于分布不相交的情况,存在梯度消失,而通过置信空间来控制梯度消失的情况。[0042]在本发明中,利用LSGAN目标函数原理,对鉴别器使用a-b编码方案,其中b是表示真实数据,a是表示假数据也就是生成数据,c表示欺骗数据。公式中C表示分类器、G表示生成器、D表示判别器下同)。对于任何固定的C和G,由目标函数UC,G,D定义博弈的最优鉴别器D,如公式(1所示:[0044]其中pax,y=l-aPgx,y+aPcx,yae〇,10[0045]给定分类器C和生成器G,结合LSGAN目标函数,其中c表示G、C希望D相信假数据的值,目标函数可以重写为公式2:[0046][0047]当Px,y=Pax,y时,构造全局最小函数VC,G,公式2转变为公式3:[0049]当b_c=l和b_a=2时,根据LSGAN的推导,公式⑶可推导为:[0051]由公式⑷可以推导出全局最小函数VC,G基于分布。[0052]其中PaX,y=1-aPgX,y+aPc;X,yaGOd,两边取积分得到如公式⑶所示:[0053]JPx,y=a-αJPgx,ydx+aJPcx,ydx5;[0054]根据公式2将目标函数对VC,G取最小值,对D做最大值判断,得到目标函数如公式6所示:[0056]当b-c=I、b-a=2、PX,y=PaX,y时,VG,C=0,引起训练不平衡,使结果无法达到最优。为了解决此问题,构造Rc函数,Rc利用:,分布置信度控制及分布原理,对判别器、分类作分布平衡构造,即:[0058]结合公式⑶、⑵推理,得到最终目标函数公式⑶:[0060]当b-c=l、b_a=2,即a,b,c编码标记的数据分别取-1,1,〇时,说明损失函数满足最小化散度分布。[0061]其中:X表示生成数据,y表示类标签,z表示生成数据X对应的叶子节点;a表示生成器G对生成数据进行编码,ae{-1,〇,1};b表示分类器C对类标签进行编码,be{-1,〇,1};C表示生成器G对生成数据通过目标函数判别最优的欺骗样本数据,Ce{-1,〇,1};此公式中:Ex,y:ix,y:表示标签对x,y在判别器⑶中联合分布Px,y的期望值;Dx,y表示判别器中标签对X,y的真实样本标签对伪标签的概率;表示标签对X,y在分类器C中联合分布Pcx,y的期望值;:表示标签对x,y在生成器G中联合分布Pgx,y的期望值;Gy,z表示生成器中标签对y,z在样本空间的映射,D;Gy,z,y表示判别器中标签对y,z的生成样本对真实样本的概率;R。表示平衡函数;α是调节参数,αe{0,1}〇[0062]在本发明中,损失函数与目标函数通用。[0063]与现有技术相比较,本发明的技术方案具有以下有益技术效果:[0064]1、基于分布,使模型更加稳定,避免梯度的消失,使模型收敛更加快速;[0065]2、将标签手动标记改为自动标记,同时通过随机森林叶子节点标记标签,使标签标记更加均匀;[0066]3、结合随机森林预测分析和叶子节点标记标签,更加快速迭代预测生成器生成的数据。附图说明[0067]图1为本发明的总体结构图;[0068]图2为本发明实施例中随机森林与KL散度分布及分布的错误率对比图;[0069]图3为本发明实施例中Triple-GAN优化模型损失函数交叉损失分布图;[0070]图4为minist的原始图像;[0071]图5为采用本发明的方法后,minist的分类图像。具体实施方式[0072]根据本发明提供的实施方式,提供一种基于Triple-GAN的分类方法。[0073]一种基于Triple-GAN的分类方法,该方法包括以下步骤:[0074]1获取真实样本;基于Triple-GAN构建三人游戏模型,三人游戏模型由分类器C、生成器G、判别器⑶组成;将真实样本序列化后输入到分类器C中;判别器⑶由一个基于二叉决策树预测分析随机森林构成,其中随机森林由m棵树组成:;其中:n为真实样本的个数,h为二叉决策树高度,h为大于等于3的整数;形成2H*m个叶子节点,将叶子节点作为真实样本标签;[0075]2基于Triple-GAN构建分布的分类器C、生成器G、判别器⑶的目标函数;[0076]3将训练样本输入到生成器G中,形成生成数据;根据目标函数区分真实样本标签和生成数据的差距,当目标函数达到平衡时,将生成数据标记标签,通过标记的标签对图像也就是生成数据进行分类。[0077]在本发明中,步骤1具体为:[0078]101下载minist、svhn、cifarlO中的一种或多种图像,作为真实样本,序列化后,输入到分类器C中;[0079]102三人游戏模型根据随机森林算法构建二叉决策树,将η个真实样本分配到m颗决策树中;[0080]103将m棵决策树的叶子节点标记标签,形成类标签y。[0081]在本发明中,步骤3具体为:[0082]301下载minist、svhn、cifarlO中的一种或多种图像,作为训练样本;[0083]302将训练样本进行序列化形成生成数据X,将生成数据X作为训练集数据输入到生成器G中;[0084]303利用类标签y和生成数据X组成联合分布;[0085]304根据目标函数区分生成数据X和类标签y的差距,当目标函数达到平衡时,将生成数据X标记标签,通过标记的标签对图像也就是生成数据进行分类。[0086]在本发明中,利用类标签y和生成数据X组成联合分布,具体步骤如下:[0087]1生成数据X和类标签y在生成器G中组成生成器联合分布Pgx,y;[0088]2根据随机森林算法构建二叉决策树逻辑对生成器联合分布Pgx,y的进行判断:[0089]当生成器联合分布Pgx,y的内容与决策树一致时,进入下一分支进行判断,直到找到所有生成数据X对应的叶子节点,构建生成数据X对应的叶子节点和类标签y的分类器联合分布Pcx,y;[0090]当生成器联合分布Pgx,y的内容与决策树不一致时,贝Ij进入下一棵森林决策树,迭代步骤2的过程,直到找到所有生成数据X对应的叶子节点。[0091]在本发明中,步骤2具体为:将生成器联合分布Pgx,y和分类器联合分布PcX,y输入到判别器⑶中,根据生成数据X对应的叶子节点和类标签y的分类器联合分布PcX,y和分布计算出最优化的目标函数;其中,设定分类器C、生成器G、判别器D目标函数如下:[0093]其中:X表示生成数据,y表示类标签,z表示生成数据X对应的叶子节点;a表示生成器G对生成数据进行编码,ae{-1,〇,1};b表示分类器C对类标签进行编码,be{-1,〇,1};c表示生成器G对生成数据通过目标函数判别最优的欺骗样本数据,ce{-1,〇,1};此公式中:Ex,y:ix,y:表示标签对x,y在判别器⑶中联合分布px,y的期望值;Dx,y表示判别器中标签对x,y的真实样本标签对伪标签的概率;表示标签对x,y在分类器C中联合分布Pcx,y的期望值表示标签对x,y在生成器G中联合分布Pgx,y的期望值;Gy,z表示生成器中标签对y,z在样本空间的映射,D;Gy,z,y表示判别器中标签对y,z的生成样本对真实样本的概率;R。表示平衡函数;α是调节参数,αe{0,1}〇[0094]作为优选,a取值为-I,b取值为I,c取值为0,S卩13-〇=1、13-=2;平衡函数,目标函数满足最小化:散度分布;其中:P是判别器的概率联合分布,Pc是分类器的概率联合分布。[0095]在本发明中,所述目标函数达到平衡是指:当判别器达到最优时,即目标函数达到〇.5时,将生成数据X标记标签,形成样本数据,通过插值的方式将样本数据插入到输出数据中,该生成数据X分类完成;[0096]当判别器没有达到最优时,通过平衡函数Rc调节,直到目标函数达到最优,即目标函数达到0.5。[0097]作为优选,该方法还包括:Triple-GAN优化模型不断的训练,直到所有生成数据X都标记标签,将生成数据X形成的样本数据按照类标签y顺序分类输出,即生成数据X分类完成。[0098]作为优选,步骤101中图像数量超过1万张;步骤101中的序列化采用list形式。[0099]作为优选,步骤301中图像数量超过1万张;步骤302中的序列化采用list形式。[0100]实施例[0101]现在广泛采用的数据集MNIST。其中MNIST包括60,000个训练样本,10,000个验证样本和10,OOO个手写数字大小为28X28的测试样本。[0102]IMNIST数据集可在Kaggle上获得。将train,csv下载到数据文件夹后,将文件加载到训练数据中。[0103]2生成器根据训练数据,生成标记伪标签的样本数据。[0104]将MNIST的10,000个验证样本数据集输入到分类器C,根据基于二叉决策树的随机森林算法建立以深度为M的决策树,设定决策树高度为5,建立304颗二叉决策树,分别建立的二叉决策树标记标签。[0105]3分类器预测样本与类标签联合分布:[0106]60,000个MNIST训练数据集,输入到生成器中,生成数据X和类标签y组成联合分布Pgx,y。判别器通过随机森林决策树预测分析,找到y标签的叶子节点,形成叶子节点数据X和y标签的联合分布Pcx,y。[0107]4根据生成器联合分布Pgx,y和分类器联合分布Pcx,y输入到判别器,通过目标函数判断PgX,y与Pcx,y是否达到最优解,即目标函数达到50%。根据分类器联合分布Pcx,y和分布计算出最优化的目标函数,对分类器C、生成器G、判别器⑶目标函数如下:[0109]取值a,b,c编码标记的数据分别取-1,1,0;SPb-c=l、b-a=2;此时,损失函数(即目标函数)满足最小化ό散度分布。[0110]目标函数跟triple-GAN主要在损失函数构造时基于的分布不同,Triple-GAN基于kl散度分布,而上述目标函数是基于分布。[0111]当判别器达到最优时,即目标函数达到50%时,输出带标签的样本数据,通过插值的方式将生成数据X标记了标签的数据插入到y标签输出数据中。Triple-GAN优化模型不断的训练,将未标记的生成数据X全部标记上B编码标签,达到以相同编码分类的效果。[0112]5将60,000个训练样本MNIST数据集分类如图4分类效果所示。[0113]从图2中可以看出:随机森林、分布随着迭代次数的增加,错误率明显低于KL散度分布。[0114]从图3中可以看出:交叉损失分布在2.5%〜5%之间,错误率维持在相对较低区间,说明TripIe-GAN优化模型比较稳定。

权利要求:1.一种基于Triple-GAN的分类方法,该方法包括以下步骤:1获取真实样本;基于Triple-GAN构建三人游戏模型,三人游戏模型由分类器C、生成器G、判别器⑶组成;将真实样本序列化后输入到分类器C中;判别器⑶由一个基于二叉决策树预测分析随机森林构成,其中随机森林由m棵树组成其中:n为真实样本的个数,h为二叉决策树高度,h为大于等于3的整数;形成21-1*!!!个叶子节点,将叶子节点作为真实样本标签;2基于Triple-GAN构建分布的分类器C、生成器G、判别器⑶的目标函数;3将训练样本输入到生成器G中,形成生成数据;根据目标函数区分真实样本标签和生成数据的差距,当目标函数达到平衡时,将生成数据标记标签,通过标记的标签对图像也就是生成数据进行分类。2.根据权利要求1所述的分类方法,其特征在于:步骤1具体为:101下载miniSt、svhn、cifar10中的一种或多种图像,作为真实样本,序列化后,输入到分类器C中;102三人游戏模型根据随机森林算法构建二叉决策树,将η个真实样本分配到m颗决策树中;103将m棵决策树的叶子节点标记标签,形成类标签y。3.根据权利要求1所述的分类方法,其特征在于:步骤3具体为:301下载minist、svhn、cifar10中的一种或多种图像,作为训练样本;302将训练样本进行序列化形成生成数据X,将生成数据X作为训练集数据输入到生成器G中;303利用类标签y和生成数据X组成联合分布;304根据目标函数区分生成数据X和类标签y的差距,当目标函数达到平衡时,将生成数据X标记标签,通过标记的标签对图像也就是生成数据进行分类。4.根据权利要求3所述的分类方法,其特征在于:利用类标签y和生成数据X组成联合分布,具体步骤如下:1生成数据X和类标签y在生成器G中组成生成器联合分布Pgx,y;⑵根据随机森林算法构建二叉决策树逻辑对生成器联合分布PgX,y的进行判断:当生成器联合分布Pgx,y的内容与决策树一致时,进入下一分支进行判断,直到找到所有生成数据X对应的叶子节点,构建生成数据X对应的叶子节点和类标签y的分类器联合分布Pcx,y;当生成器联合分布Pgx,y的内容与决策树不一致时,则进入下一棵森林决策树,迭代步骤2的过程,直到找到所有生成数据X对应的叶子节点。5.根据权利要求4所述的分类方法,其特征在于:步骤2具体为:将生成器联合分布Pgx,y和分类器联合分布Pcx,y输入到判别器〇中,根据生成数据X对应的叶子节点和类标签y的分类器联合分布Pcx,y和分布计算出最优化的目标函数;其中,设定分类器C、生成器G、判别器⑶目标函数如下:其中:X表示生成数据,y表示类标签,Z表示生成数据X对应的叶子节点;a表示生成器G对生成数据进行编码,ae{-1,〇,1};b表示分类器C对类标签进行编码,be{-1,〇,1};C表示生成器G对生成数据通过目标函数判别最优的欺骗样本数据,ce{-1,〇,1};此公式中:Ex,yix,y:表示标签对x,y在判别器D中联合分布Px,y的期望值;Dx,y表示判别器中标签对x,y的真实样本标签对伪标签的概率;:表示标签对x,y在分类器C中联合分布Pcx,y的期望值;表示标签对x,y在生成器G中联合分布Pgx,y的期望值;Gy,z表示生成器中标签对y,z在样本空间的映射,DGy,z,y表示判别器中标签对y,z的生成样本对真实样本的概率;R。表示平衡函数;α是调节参数,ae{〇,1}〇6.根据权利要求5所述的分类方法,其特征在于:a取值为-I,b取值为I,c取值为O,即b-c=l、b_a=2;平衡函数,目标函数满足最小化散度分布;其中:P是判别器的概率联合分布,Pc是分类器的概率联合分布。7.根据权利要求3-6中任一项所述的分类方法,其特征在于:所述目标函数达到平衡是指:当判别器达到最优时,即目标函数达到〇.5时,将生成数据X标记标签,形成样本数据,通过插值的方式将样本数据插入到输出数据中,该生成数据X分类完成;当判别器没有达到最优时,通过平衡函数Re调节,直到目标函数达到最优,即目标函数达到0.5。8.根据权利要求7所述的分类方法,其特征在于:该方法还包括=Triple-GAN优化模型不断的训练,直到所有生成数据X都标记标签,将生成数据X形成的样本数据按照类标签y顺序分类输出,即生成数据X分类完成。9.根据权利要求2所述的分类方法,其特征在于:步骤101中图像数量超过1万张;步骤101中的序列化采用list形式。10.根据权利要求3所述的分类方法,其特征在于:步骤301中图像数量超过1万张;步骤302中的序列化采用list形式。

百度查询: 湘潭大学 一种基于Triple-GAN的分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。