恭喜上海松鼠课堂人工智能科技有限公司王鑫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海松鼠课堂人工智能科技有限公司申请的专利关键内容提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112035646B 。
龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010905863.9,技术领域涉及:G06F16/3329;该发明授权关键内容提取方法是由王鑫设计研发完成,并于2020-09-01向国家知识产权局提交的专利申请。
本关键内容提取方法在说明书摘要公布了:本发明公开了一种关键内容提取方法,通过获取待提取关键内容的学科信息,根据所述学科信息,生成对应的学科知识库;从所述学科知识库提取原始文本,对原始文本进行数据处理,得到对应的目标文本;对所述目标文本进行分词处理和聚类分析,并按照预设分析方法获得所述目标文本中的关键内容,所述关键内容包括知识点和或关键词。该技术方案达到了在学科对应的文本中自动提取关键内容的目的,提高了关键内容的提取效率和提取准确率,相较于人工标注习题进行手动提取的方式,本发明关键内容的提取方式提高了工作效率,同时也节约了大量的人力。
本发明授权关键内容提取方法在权利要求书中公布了:1.一种关键内容提取方法,其特征在于,所述方法包括:获取待提取关键内容的学科信息,根据所述学科信息,生成对应的学科知识库;从所述学科知识库提取原始文本,对原始文本进行数据处理,得到对应的目标文本;对所述目标文本进行分词处理和聚类分析,并按照预设分析方法获得所述目标文本中的关键内容,所述关键内容包括知识点和或关键词;其中,所述对所述目标文本进行分词处理和聚类分析,并按照预设分析方法获得所述目标文本中的关键内容,包括:对所述目标文本进行分词处理,得到对应的若干个分词词汇,计算每个分词词汇的当前热度值;对所述若干个分词词汇进行聚类分析,得到各类分词词汇各自对应的分词词汇集合;按照预设的N种词汇提取方式对每个分词词汇集合中的目标词汇进行提取,获得每个分词词汇集合各自对应的多个提取词汇集合,每个提取词汇集合中包括相应的目标词汇;根据所述目标词汇的所述当前热度值,确定每个提取词汇集合各自对应的综合有效值;将所述综合有效值由大到小进行排序,得到排列在前n个的提取词汇集合;对所述前n个提取词汇集合中每个提取词汇集合的关键内容进行提取,获得所述目标文本中的关键内容;其中,所述计算每个分词词汇的当前热度值,包括:利用公式1,计算每个分词词汇的当前热度值: 公式1中,Sk表示第k个分词词汇的当前热度值;βk表示第k个分词词汇的词汇属性值,为预设值,取值范围为[1,5];n表示预设的总时间段中所包括的单位时间段的数量;χki表示所述第k个分词词汇在第i个单位时间段的关注度;χk′表示所述第k个分词词汇在总时间段的平均关注度;χkmax表示所述第k个分词词汇在总时间段内的所有单位时间段内的最大关注度;其中,所述χki的计算方式如下公式2: 其中,pki表示所述第k个分词词汇在第i个单位时间段内的搜索频次;P1i表示在第i个单位时间段内的搜索不同分词词汇的总频次;其中,所述根据所述目标词汇的所述当前热度值,确定每个提取词汇集合各自对应的综合有效值,包括:利用公式3和公式4,计算每个提取词汇集合各自对应的综合有效值,则有: 其中,Za表示第a个提取词汇集合的综合有效值;m表示用所述N种词汇提取方式分别对所述第a个提取词汇集合中的目标词汇进行提取时,最终被提取出的所有词汇的总数目;Saj表示被提取出的第j个词汇的当前热度值;pamax表示用所述N种词汇提取方式分别对所述第a个提取词汇集合中的目标词汇进行提取时,在被提取出的词汇中,被提取次数最多的词汇对应的被提取概率;pamin表示用所述N种词汇提取方式分别对所述第a个提取词汇集合中的目标词汇进行提取时,在被提取出的词汇中,被提取次数最少的词汇对应的被提取概率;daj表示被提取出的第j个词汇在采用N种词汇提取方式提取过程出现的总次数;kad表示采用第d种词汇提取方式提取所述第a个提取词汇集合的过程中,提取的词汇个数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海松鼠课堂人工智能科技有限公司,其通讯地址为:200237 上海市徐汇区宜州路188号2幢9层、10层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。