买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州凡闻科技有限公司
摘要:本发明提供一种基于深度学习的数据分类方法以及图谱的建立方法,其中数据分类的方法包括:提取基础文章中的核心关键词,计算核心关键词的权重值,建立第一权重对应表,提取每篇基础文章的关键词,根据第一权重对应表计算每篇文章的行业匹配度,得出第一匹配度阈值,根据第一匹配度对基础文章进行迭代;根据迭代的文章重复上述步骤,获得第二权重对应和第二匹配度阈值;利用第二匹配度阈值判断新文章是否属于目标行业。本发明利用基础文章提取关键词并将关键词分为标题关键词和正文关键词,赋予不同的调节因子,可以更有效地计算出行业匹配度,再利用匹配度更高的文章进行更精准地替换迭代,释放了存储历史数据的空间,更快速地获得最优的模型。
主权项:1.一种基于深度学习的数据分类方法,其特征在于,包括以下步骤:获取若干基础文章,从若干所述基础文章中提取若干个核心关键词,计算所述核心关键词的权重值,根据核心关键词以及权重值建立第一权重对应表;提取每篇基础文章中的标题关键词和正文关键词,根据第一权重对应表查询标题关键词的权重值与正文关键词的权重值,根据所述标题关键词的权重值与正文关键词的权重值计算每篇基础文章的行业匹配度;根据所述每篇基础文章的行业匹配度获得第一匹配度阈值;提取待匹配文章的标题关键词和正文关键词,计算待匹配文章的行业匹配度,当所述待匹配文章的行业匹配度大于所述第一匹配度阈值时,所述待匹配文章替换所述基础文章中行业匹配度最低的一篇基础文章,当所有基础文章的行业匹配度均大于所述第一匹配度阈值时,停止迭代,获得文章分类模型;利用文章分类模型中的文章重复上述步骤,获得第二权重对应表,并根据第二权重对应表获得第二匹配度阈值;利用所述文章分类模型计算待计算文章的行业匹配度,当待计算文章的行业匹配度大于所述第二匹配度阈值时,则判定所述待计算文章属于目标行业。
全文数据:
权利要求:
百度查询: 杭州凡闻科技有限公司 一种基于深度学习的数据分类方法以及图谱的建立方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。