Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浪潮云信息技术股份公司王意彤获国家专利权

浪潮云信息技术股份公司王意彤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浪潮云信息技术股份公司申请的专利一种基于大模型和Labeled-LDA的文本分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119293247B

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411348758.4,技术领域涉及:G06F16/353;该发明授权一种基于大模型和Labeled-LDA的文本分类方法及系统是由王意彤;王洪超;孙向晖;姜亚楠;张立勇设计研发完成,并于2024-09-26向国家知识产权局提交的专利申请。

一种基于大模型和Labeled-LDA的文本分类方法及系统在说明书摘要公布了:本发明涉及文本分类技术领域,具体为一种基于大模型和Labeled‑LDA的文本分类方法及系统,数据收集、数据预处理,特征提取,训练模型,特征融合,基于融合特征训练分类模型,并通过交叉验证方法评估模型性能,根据评估结果调整模型参数、进行特征选择和模型调优,最终部署至生产环境,实现文本的自动化分类;有益效果为:本发明提出的基于大模型和Labeled‑LDA的文本分类方法及系统,通过结合两种模型的优点,尤其是在处理具有复杂主题和语义的文本时可以提高文本分类任务的性能。

本发明授权一种基于大模型和Labeled-LDA的文本分类方法及系统在权利要求书中公布了:1.一种基于大模型和Labeled-LDA的文本分类方法,其特征在于:所述方法包括以下步骤: S01:数据收集、数据预处理:收集目标领域的文本数据,进行预处理操作,包括但不限于分词、去除停用词、词干提取,为后续特征提取准备高质量的文本数据集; S02:特征提取:利用大模型对预处理后的文本进行编码,提取反映文本深层语义的向量表示;应用Labeled-LDA模型对文本进行主题建模,提取文本的主题分布特征,增强对文本结构的理解; S03:训练模型:进行模型设置,定义模型参数,包括主题数量K、Dirichlet先验分布的超参数α——文档-主题分布的平滑度和β——主题-词分布的平滑度,以及如何结合监督信息的策略,使用标注数据训练Labeled-LDA模型,以识别文本中的主题及其与类别的关联;选择预训练的大模型,或者在特定数据集上进行微调以适应文本分类任务;利用标记的文本数据集训练Labeled-LDA模型,使模型学习到主题与文本类别间的关联性,根据任务需求,对大模型进行微调,使其更好地适应特定的文本分类任务; S04:特征融合:将大模型提取的特征与Labeled-LDA提取的主题特征进行融合,以期捕捉文本的多维度信息; S05:基于融合特征训练分类模型,并通过交叉验证方法评估模型性能,根据评估结果调整模型参数、进行特征选择和模型调优,最终部署至生产环境,实现文本的自动化分类; 步骤S03包括: 训练模型:使用标注的文本数据集来训练Labeled-LDA模型,通过迭代EM算法,模型逐步优化文档-主题和主题-词的分布,使得模型能够学习到主题与文本类别间的内在联系;先初始化:随机或基于某种启发式方法初始化文档-主题分布和主题-词分布,然后迭代更新:采用吉布斯采样等算法迭代地更新每个文档的主题分配和每个主题的词分布;在每次迭代中,Labeled-LDA会监督信息的影响,通过调整采样概率或直接在目标函数中加入正则项来引导模型学习,监控似然函数或其他收敛指标,多次迭代间的差异,当变化小于设定阈值时认为模型收敛; 使用标注的文本数据集来训练大模型:选择合适的模型架构,设定模型参数,包括层数、隐藏层大小、注意力头数,使用预处理后的数据集对模型进行训练;训练过程涉及前向传播计算预测、计算损失函数、反向传播调整权重参数,通过梯度下降或其他优化算法最小化损失,进行多轮迭代;选择在特定任务相关的数据集上对大模型进行微调,以适应特定的文本分类任务;微调过程中,通过调整模型的顶层或部分层权重,使之更贴合目标分类任务的需求。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮云信息技术股份公司,其通讯地址为:250100 山东省济南市高新区浪潮路1036号浪潮科技园S01号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。