买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及项目处理技术领域,公开了一种基于多新息理论的深度学习的数字化项目查重方法,判断项目信息数据集和近义词数据集是否符合训练条件;当符合训练条件时,构建多新息理论公式;确定预先训练的卷积神经网络算法,基于项目信息数据集、近义词数据集和多新息理论公式对卷积神经网络算法进行微调,得到多新息卷积神经网络;确定多新息卷积神经网络全连接层的输出值,将输出值和项目信息训练集的类型值进行比对,判断是否存在重复项目,本发明可以对预先训练的卷积神经网络算法的各层参数进行反向微调,提高卷积神经网络的计算收敛速度,提高近义词提取的精度,准确识别重复的项目,保证项目查重效率、准确度和查全率。
主权项:1.一种基于多新息理论的深度学习的数字化项目查重方法,其特征在于,包括:获取项目信息数据集和近义词数据集,并对所述项目信息数据集合和所述近义词数据集进行分析,判断所述项目信息数据集和近义词数据集是否符合训练条件;当判断所述项目信息数据集和近义词数据集符合训练条件时,构建多新息理论公式;确定预先训练的卷积神经网络算法,并基于所述项目信息数据集、近义词数据集和所述多新息理论公式对所述卷积神经网络算法进行微调,得到多新息卷积神经网络;确定所述多新息卷积神经网络全连接层的输出值,并将所述输出值和项目信息训练集的类型值进行比对,基于对比结果判断是否存在重复项目;当判断所述项目信息数据集和近义词数据集符合训练条件时,构建多新息理论公式时,包括: ;其中,为多新息理论函数,t为当前的时间步或迭代次数,表示增益矩阵,且,R为实数集,n为增益矩阵的行数,p为增益矩阵的列数,即新息长度,表示新息向量,,且p≥1则表示新息长度,当p=1时,就退化为标准新息;在确定预先训练的卷积神经网络算法时,包括:确定所述卷积神经网络算法的非线性误差函数: ;其中,为卷积神经网络算法的非线性误差函数,卷积层中的卷积核参数,为网络层,为全连接层的权值,为偏置值,L为网络层的数量,hn为第n个网络层的输出值,yn为第n个网络层的期望输出值;基于反向传播算法和梯度下降方法训练非线性误差函数,并将网络参数进行调整,其中,每次迭代的参数更新值为: ;其中,为卷积层参数,i为卷积核在输出特征图的行索引,j为卷积核在输出特征图上的列索引; ;其中,为下采样层参数; ;其中,为全连接层的参数,W为权重矩阵;在基于所述项目信息数据集、近义词数据集和所述多新息理论公式对所述卷积神经网络算法进行微调,得到多新息卷积神经网络时,包括:基于所述多新息理论公式将所述卷积神经网络算法的每一个网络层的输出节点x扩展为输出向量; ;其中,为输出向量,ts为时间步s时的目标值t,T为转置操作;根据所述输出向量对所述卷积层参数、所述下采样层参数和所述全连接层进行更新,得到对应的卷积层更新参数、下采样层更新参数和全连接层更新参数;基于所述卷积层更新参数、所述下采样层更新参数、所述全连接层更新参数、所述近义词数据集和所述项目信息数据集得到多新息卷积神经网络;在根据所述输出向量对所述卷积层参数、所述下采样层参数和所述全连接层进行更新,得到对应的卷积层更新参数、下采样层更新参数和全连接层更新参数时,包括: ;其中,为卷积层更新参数,m为列索引; ;其中,为下采样层更新参数,D为下采样层的权重; ;其中,为全连接层更新参数;在基于所述卷积层更新参数、所述下采样层更新参数、所述全连接层更新参数、所述近义词数据集和所述项目信息数据集得到多新息卷积神经网络时,包括:将所述近义词数据集输入到输出层;根据所述卷积层更新参数得到卷积层的输出值: ;其中,为卷积层的输出值,M为卷积层输出的特征图的数量;根据所述下采样层更新参数得到下采样层的输出值: ;其中,为下采样层的输出值,down是一个权重,用于调整输入特征图到输出特征图的映射强度;根据所述全连接层更新参数得到全连接层的输出值: ;其中,为全连接层的输出值。
全文数据:
权利要求:
百度查询: 温州市数安港管理服务中心 一种基于多新息理论的深度学习的数字化项目查重方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。