买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安邮电大学
摘要:本发明公开了基于粒子群算法优化正则化极限学习机的文本情感分析方法。包括以下步骤:1获取待分析数据的文本信息,对所述文本信息进行预处理得到文本词汇;2将文本词汇采用skip‑gram模型基于同领域数据集语料库进行词向量训练得到文本词向量;3利用粒子群算法将正则化极限学习机的参数初始化为一群随机粒子,然后通过迭代确定最佳参数,得到粒子群算法优化正则化极限学习机;4将文本词向量输入粒子群算法优化正则化极限学习机,对文本信息进行情感分类。本发明提出采用粒子群算法对正则化极限学习机的三种超参数在一定范围内进行寻优。在使运算精度得以提升的同时,使得网络结构更加紧凑。此外,保证了模型良好的泛化性能。
主权项:1.基于粒子群算法优化正则化极限学习机的文本情感分析方法,其特征在于,包括以下步骤:获取待分析数据的文本信息,对所述文本信息进行预处理得到文本词汇;将所述文本词汇采用skip-gram模型基于同领域数据集语料库进行词向量训练得到文本词向量;同领域数据集语料库建立的具体步骤为:S21、对所述文本词汇按照词性进行分类,得到分词词语集;S22、对分词词语集中的每种词语采用skip-gram模型进行词向量训练;S23、选出步骤S22处理后词向量的高频词,构建成同领域数据集语料库;利用粒子群算法将正则化极限学习机的参数初始化为一群随机粒子,然后通过迭代确定最佳参数,得到粒子群算法优化正则化极限学习机;采用粒子群算法优化正则化极限学习机的具体步骤为:S31、设置隐藏层节点数范围、正则化系数倒数范围和激活函数,确定最大迭代次数;S32、采用均匀分布初始化一系列粒子形成种群,得到初始超参数;S33、根据初始超参数建立正则化极限学习机模型,采用五折交叉验证法对粒子进行训练并根据适应度函数计算auc值,将auc值作为各粒子适应度值;适应度函数为:;S34、判断是否满足终止条件,终止条件为auc值最大或达到最大迭代次数;若不满足终止条件,则确定粒子最优值pbest和种群最优值gbest,根据粒子i在d维空间中的位置和速度公式更新粒子位置,得到更新后的超参数,并以更新后的超参数继续进行步骤S33,更新粒子位置的位置和速度公式如下: 式中和分别为t时刻i粒子的速度和位置,和为学习因子,rand为介于0和1之间的随机数,为惯性权重;若满足终止条件,输出最优粒子位置;S35、依据输出的最优粒子位置所对应的超参数构建得到粒子群算法优化正则化极限学习机;将所述文本词向量输入粒子群算法优化正则化极限学习机,对所述文本信息进行情感分类。
全文数据:
权利要求:
百度查询: 西安邮电大学 基于粒子群算法优化正则化极限学习机的文本情感分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。