恭喜之江实验室李晓晨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜之江实验室申请的专利一种基于大模型的潜在绿色企业挖掘方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119066185B 。
龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411574862.5,技术领域涉及:G06F16/3329;该发明授权一种基于大模型的潜在绿色企业挖掘方法和装置是由李晓晨;王艺涵;刘扶芮设计研发完成,并于2024-11-06向国家知识产权局提交的专利申请。
本一种基于大模型的潜在绿色企业挖掘方法和装置在说明书摘要公布了:本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置,包括:对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调;获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息,并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理;将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时由人工对输出结果进行二次确认得到确认结果,将确认结果作为标签对大语言模型进行训练;利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计,极大削减了人力成本,简化了潜在绿色企业的挖掘流程,缩短潜在绿色企业的挖掘周期。
本发明授权一种基于大模型的潜在绿色企业挖掘方法和装置在权利要求书中公布了:1.一种基于大模型的潜在绿色企业挖掘方法,其特征在于,包括以下步骤:使用绿色产业相关文件对大语言模型基座进行领域预训练,并通过问答方式组织绿色企业数据输入领域预训练后的大语言模型中进行绿色企业与绿色产业识别任务的微调;根据选取的提交绿色信贷申请企业的企业名称,运用爬虫获取每一个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息,并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理,得到经过处理的文本数据;将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时由人工对输出结果进行二次确认得到确认结果,将确认结果作为标签对大语言模型进行训练;其中,将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,包括:将经过每个企业对一个的经过处理的文本数据构建为样本,以问题对话的形式输入微调后的大语言模型,使大语言模型输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时基于损失函数对大语言模型进行训练,损失函数表示如下: ,其中,为产业分类损失函数,为绿色评价损失函数,和为对应的超参数; , ,其中,为样本总数,为真实标签的编码总位数,每个位数对应一个产业类型,为样本的关于产业类型的真实标签,如样本的真实标签文本为第位对应的产业类型,则=1,反之为0;为大语言模型对样本所属第位对应的产业类型的预测概率,其中是样本通过大语言模型计算后在第位对应的产业类型的上的原始得分,为产业类型的索引; ,其中,为判别损失,为惩罚项,和为对应的超参数; , ,其中,为样本总数,为样本的关于是否为绿色企业的真实标签,如样本是绿色企业,则=1,反之为0;为大语言模型对样本的预测标签,为样本通过大语言模型计算后在是否为绿色企业分类上的原始得分; ,其中,为样本总数,为样本的处罚金额,为样本的处罚日期距当前日期的天数,为处罚类别数,为样本的处罚类别,,、和分别对应自变量超参,最终对进行归一化处理;利用训练好的大语言模型基于新输入的经过处理的文本数据和问题得到包括是否为绿色企业以及绿色企业所属的绿色产业类别的回答,完成潜在绿色企业挖掘。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。