首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于关键词提取的文献综述数据生成方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州电子科技大学

摘要:本发明公开了一种基于关键词提取的文献综述数据生成方法。本发明首先生成出版物数据库;然后生成关键词数据库;最后分类关键词,包括初始相似度计算循环和全局遍历同时生成关键词集合表。本发明将文本相似度思想与关键词的提取相结合从而将关键词分类,关键词的集合比单个关键词更具说服力,且可以据此在时间序列上有效呈现出领域的发展趋势。

主权项:1.一种基于关键词提取的文献综述数据生成方法,其特征在于该方法包括以下步骤:步骤1.生成出版物数据库1.1抓取出版物数据使用网络爬虫技术,从目标出版物所在网页抓取出版物数据,并进行数据解析;1.2加载论文元信息加载论文元信息,包括作者、标题、摘要和出版国家,并将这些信息汇总,生成出版物数据库;步骤2.生成关键词数据库2.1预处理数据在读取出版物数据库后,删除标点符号及无意义的单词,保留连字符以保证关键词意义的完整性;2.2提取关键词采用快速自动关键词提取算法进行关键词的自动化提取,提取被提及次数最多的前N个关键词并保存至关键词数据库;步骤3.分类关键词3.1初始相似度计算循环从关键词数据库中读取数据后,选取第一个关键词,并创建一个集合,进入初始相似度计算循环:选取第二个关键词,并使用相似度算法距离计算其与第一个关键词的相似度,如果相似度的值大于预设的阈值,则将第二个词放入第一个词所在的集合,反之则创建一个新的集合;3.2全局遍历同时生成关键词集合表每次选择一个新的关键词,就计算其与前面生成的所有的集合的相似度,将其值与阈值比较从而判断其所属集合,若皆不符条件则创建新集合,如此往复直至遍历完关键词数据库中所有关键词;最后,由上述操作生成的关键词集合导出集合表。

全文数据:

权利要求:

百度查询: 杭州电子科技大学 一种基于关键词提取的文献综述数据生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。