南京理工大学戚湧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京理工大学申请的专利一种大语言模型的训练方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121256368B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511814829.X,技术领域涉及:G06F18/214;该发明授权一种大语言模型的训练方法、系统及设备是由戚湧;范俊杰设计研发完成,并于2025-12-04向国家知识产权局提交的专利申请。
本一种大语言模型的训练方法、系统及设备在说明书摘要公布了:本发明属于人工智能技术领域,公开了一种大语言模型的训练方法、系统及设备。本发明包括接收多元交通流时间序列,并转换为固定维度的交通特征张量;将可学习软提示张量在序列维度与交通特征张量拼接,形成LLM输入序列并输入LLM,生成高维输出;LLM仅引入少量可训练参数;基于高维输出和对应的目标未来交通流时间序列计算主任务损失;基于软提示张量与交通特征张量,计算跨模态辅助损失;进而构建复合损失函数并基于此函数,对LLM进行训练,优化可训练参数。本发明能够根据每一个输入大预言模型的交通流序列的独有特性,动态地、自适应地生成或调整引导信号,提高采用大语言模型进行交通流预测时更精准、更具鲁棒性。
本发明授权一种大语言模型的训练方法、系统及设备在权利要求书中公布了:1.一种大语言模型的训练方法,其特征在于,包括: 接收多元交通流时间序列X,所述多元交通流时间序列X包含历史交通流量、车辆速度或道路占有率中的至少一项,并将所述多元交通流时间序列X转换为固定维度的交通特征张量Xtensor; 将可学习的软提示张量P在序列维度上与所述交通特征张量Xtensor进行拼接,形成大语言模型输入序列Xin,并将所述大语言模型输入序列Xin输入大语言模型,生成包含预测交通状态信息的高维输出;所述大语言模型的主体参数是冻结的,仅经过参数高效微调引入若干可训练参数; 基于所述高维输出和对应的目标未来交通流时间序列,计算主任务损失;基于所述软提示张量P与所述交通特征张量Xtensor,计算二者之间的相似性度量或不相似性度量,作为跨模态辅助损失;基于所述主任务损失、跨模态辅助损失,构建复合损失函数; 基于所述复合损失函数,利用包含所述多元交通流时间序列X和所述目标未来交通流时间序列的训练样本,对所述大语言模型进行训练,优化所述可训练参数; 所述复合损失函数为: ; 其中,是主任务损失函数,用于衡量预测准确性;是跨模态辅助损失函数,用于建立提示和特征之间的关联;是由门控网络根据输入的交通特征张量Xtensor动态生成的门控权重,计算方法如下: ; 其中,Xtensor是输入门控网络的交通特征张量;GlobalPool是全局池化操作;GateNet是门控网络;是激活函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市玄武区孝陵卫街200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励