江苏苏宁银行股份有限公司孙骁晓获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏苏宁银行股份有限公司申请的专利一种行业标签分类模型的训练方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116881447B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310567118.1,技术领域涉及:G06F16/353;该发明授权一种行业标签分类模型的训练方法和装置是由孙骁晓设计研发完成,并于2023-05-19向国家知识产权局提交的专利申请。
本一种行业标签分类模型的训练方法和装置在说明书摘要公布了:本发明提出了一种行业标签分类模型的训练方法和装置,该方法包括如下步骤:选择临近的行业标签,获取所述行业标签的企业经营范围样本,并对其进行清洗;将清洗后的样本进行前处理,获得样本语句文件;对所述样本语句文件进行分词,生成样本文件;建立严格和非严格停用词文本,利用所述严格和非严格停用词文本对样本文件进行筛选;根据筛选后的样本文件生成词典,并基于所述词典生成词向量样本;建立用于行业标签分类的TextCNN模型,并设置模型结构;将所述词向量样本载入TextCNN模型,并根据模型训练效果调整模型参数,以及样本清洗策略。本发明利用关键词和停用词对样本进行清洗,再利用样本训练TextCNN模型,使模型能够进行高效的行业标签分类。
本发明授权一种行业标签分类模型的训练方法和装置在权利要求书中公布了:1.一种行业标签分类模型的训练方法,其特征在于,包括如下步骤: 选择临近的行业标签,获取所述行业标签的企业经营范围样本,并对其进行清洗,所述临近的行业标签为属于相同上级标签下的子类行业标签; 将清洗后的样本进行前处理,获得样本语句文件,所述样本语句文件与行业标签对应; 对所述样本语句文件进行分词,生成样本文件; 建立严格和非严格停用词文本,利用所述严格和非严格停用词文本对样本文件进行筛选; 根据筛选后的样本文件生成词典,并基于所述词典生成词向量样本; 建立用于行业标签分类的TextCNN模型,并设置模型结构; 将所述词向量样本载入TextCNN模型,并根据模型训练效果调整模型参数以及样本清洗策略; 对所述企业经营范围样本进行清洗,包括:根据行业分类国家标准,选取待清洗样本对应标签的上一级标签,确定样本群,所述样本群包括接近的不同行业样本;确定所述样本群中样本对应标签关键词;逐个读取待清洗样本,若所述待清洗样本中含有待清洗样本对应标签关键词且不含有其他标签关键词,则保留待清洗样本,否则删除待清洗样本; 所述建立严格和非严格停用词文本,包括:i将每个标签对应样本中都出现的词作为严格停用词文本;ii根据行业分类的要求以及经营范围描述的特征,将出现在不同样本中比例大于N且明显无区分作用的无效词作为非严格停用词文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏苏宁银行股份有限公司,其通讯地址为:210000 江苏省南京市建邺区河西金融城4号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励