浙江工业大学徐梁彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种基于语义理解模型的行业经济活动分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114116979B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111422110.3,技术领域涉及:G06F16/334;该发明授权一种基于语义理解模型的行业经济活动分类方法及系统是由徐梁彬;季白杨设计研发完成,并于2021-11-26向国家知识产权局提交的专利申请。
本一种基于语义理解模型的行业经济活动分类方法及系统在说明书摘要公布了:本发明公开了一种基于语义理解模型的行业经济活动分类方法及系统,其中涉及的分类方法,包括:S1.获取各个行业经济活动与主营产品相对应的数据集;S2.取出数据集中的无效数据,并将数据集按照国民行业分类表进行分类;S3.输入分类好的数据集中的产业经济活动,并提取产业经济活动中的关键字,使用相似度匹配算法从国民经济行业分类表和数据集中选出候选行业分类词集、伪候选行业分类词集;S4.将输入的经济活动与候选行业分类词集、伪候选行业分类词集输入到预设的BERT模型中,并通过softmax分类器输出分类结果;S5.建立以国民经济行业分类表与训练集内容为主的词典,将输出的分类结果与词典中的内容进行匹配,输出最后的结果。
本发明授权一种基于语义理解模型的行业经济活动分类方法及系统在权利要求书中公布了:1.一种基于语义理解模型的行业经济活动分类方法,其特征在于,包括: S1.获取各个行业经济活动与主营产品相对应的数据集; S2.取出数据集中的无效数据,并将数据集按照国民行业分类表进行分类; S3.输入分类好的数据集中的产业经济活动,并提取产业经济活动中的关键字,使用相似度匹配算法从国民经济行业分类表和数据集中选出候选行业分类词集、伪候选行业分类词集; S31.使用TextRank算法对数据集中的产业经济活动进行关键字提取; S32.对提取出的关键字使用Jaccard相似度算法,选出候选行业分类词集、伪候选行业分类词集; 使用Jaccard相似度算法对提取出的关键字进行匹配,遍历国民经济行业分类表中的小类,从字面上先从小类中进行寻找,按照相似度的大小排序,选取前30个候选词,构成候选行业分类词集; 使用Jaccard相似度算法,将提取出的关键字与训练数据集进行匹配,按照相似度大小排序,选取前30个匹配词构伪候选行业分类词集; S4.将输入的经济活动与候选行业分类词集、伪候选行业分类词集输入到预设的BERT模型中,并通过softmax分类器输出分类结果; S41.在单文本分类任务CLS后放入输入的经济活动、候选分类词集,然后将经济活动、候选分类词集采用语句对分类任务SEP进行分隔,进而构建BERT模型输入层的输入信息;其中,候选分类词集包括候选行业分类词集、伪候选行业分类词集; S42.将输入信息输入到预设的BERT模型输入层中处理,并将处理好的信息用softmax分类器进行分类,得到输出结果; S5.建立以国民经济行业分类表与训练集内容为主的词典,将输出的分类结果与词典中的内容进行匹配,输出最后的结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。