上海大学陈雪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海大学申请的专利一种融合文本结构信息和语义信息的文本关键词抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113642325B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110815799.X,技术领域涉及:G06F40/289;该发明授权一种融合文本结构信息和语义信息的文本关键词抽取方法是由陈雪;王小飞;王鹏设计研发完成,并于2021-07-19向国家知识产权局提交的专利申请。
本一种融合文本结构信息和语义信息的文本关键词抽取方法在说明书摘要公布了:本发明公开了一种融合文本结构信息和语义信息的文本关键词抽取方法,具体步骤如下:1对单篇文本的段落进行重新组合,构成新文本;2对新文本进行预处理,包括分词、词性标注和去除停用词,保留名词和动词作为候选关键词;3计算每个候选关键词的结构权重;4计算每个候选关键词的语义权重;5根据步骤3所得的结构权重和步骤4所得的语义权重,计算每个后选关键词的权重,并选择权重最高的K个候选关键词作为文本的关键词。本方法充分利用文本自身结构特点和语义特点,无需依赖领域文本集,且无需进行循环收敛计算,因此简便且效果更好。
本发明授权一种融合文本结构信息和语义信息的文本关键词抽取方法在权利要求书中公布了:1.一种融合文本结构信息和语义信息的文本关键词抽取方法,其特征在于,具体步骤如下: 1对单篇文本的段落进行重新组合,构成新文本; 2对新文本进行预处理,包括分词、词性标注和去除停用词,保留名词和动词作为候选关键词; 3计算每个候选关键词的结构权重; 4计算每个候选关键词的语义权重; 5根据步骤3所得的结构权重和步骤4所得的语义权重,计算每个候选关键词的权重,并选择权重最高的K个候选关键词作为文本的关键词; 所述步骤3中计算每个候选关键词的结构权重;对于一个候选关键词vi,其结构权重strvi,k计算公式如下: 其中,i≤m,m为该文本中候选关键词的个数;k表示文本的第k段,k=1…n,freqvi,k表示候选关键词vi在第k段的词频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海大学,其通讯地址为:200444 上海市宝山区上大路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。