清华大学深圳国际研究生院许银亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学深圳国际研究生院申请的专利一种基于大语言模型的光伏发电少样本可迁移预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120045943B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510529749.3,技术领域涉及:G06F18/214;该发明授权一种基于大语言模型的光伏发电少样本可迁移预测方法是由许银亮;夏晨越设计研发完成,并于2025-04-25向国家知识产权局提交的专利申请。
本一种基于大语言模型的光伏发电少样本可迁移预测方法在说明书摘要公布了:一种基于大语言模型的光伏发电少样本可迁移预测方法,包括:对光伏时序数据进行极值归一化与分块切割,生成适配大语言模型输入的嵌入模块;融合高阶偏相关性分析与门控残差网络动态分配特征权重,提取多维数据中时空依赖与非线性关联特征;将结构化时序特征映射至大语言模型语义空间,利用掩码多头注意力机制实现与预训练语料库的高保真对齐;基于预设模板生成包含数据背景、领域模式及统计特征的提示词前缀,引导大语言模型精准解析时序语义;通过冻结参数的预训练大语言模型生成自然语言预测结果,最终经线性投影反解析为数值化发电预测值。本发明能够有效解决传统模型在数据稀缺场景下的泛化能力不足及跨场站迁移预测稳定性差等问题。
本发明授权一种基于大语言模型的光伏发电少样本可迁移预测方法在权利要求书中公布了:1.一种基于大语言模型的光伏发电少样本可迁移预测方法,其特征在于,包括以下步骤: S1、输入分割:对原始光伏时序数据进行归一化及分块切割,生成适配大语言模型输入的嵌入模块; S2、特征提取:通过高阶偏相关性分析与门控残差网络动态分配特征权重,提取多维数据的非线性关联特征;具体包括:基于高阶偏相关性分析动态评估变量间的关联强度,排除多重共线性干扰;采用门控残差网络结合门控机制和残差连接,提取多维数据的非线性特征;通过双层特征选择机制融合统计分析与深度学习结果,生成加权归一化特征向量; S3、语义对齐:将时序特征映射至大语言模型语料库的语义空间,完成自然语言对齐;具体包括: 对大语言模型语料库进行降维压缩; 采用掩码多头自注意力机制,将时序数据与语料库中的Token进行匹配; 其中,使用如下的多头自注意力机制来将每个Patch与语料库中的Token进行匹配:在Token匹配中,为待匹配的时序数据Patch,为降维后的语料库,为最终匹配到的Token序列;匹配过程通过自注意力机制完成,计算方式如下: , 式中,是归一化函数,是自注意力机制计算结果;其中,引入掩码矩阵,计算方式如下: , 式中,是键的维度; 在所有注意力头上共享值权重矩阵,并采用加法聚合,计算方式如下: , 式中,为聚合后的注意力输出,是共享的值权重矩阵,是注意力权重,计算方式如下: , 式中,是注意力头的数量,和是第个注意力头对应的查询和键的权重矩阵; 基于所述自注意力机制,数据Patch匹配到语料库Token,形成Token序列: ; 将自注意力机制扩展到多头注意力机制,计算方式如下: , 其中,表示多头注意力机制的计算结果; 组合经过以上掩码多头自注意力机制匹配生成的发电数据的Token序列与外部特征数据的Token序列,生成适配大语言模型的输入格式; S4、提示生成:基于预设提示词模板生成包含背景、领域、指令及统计信息的提示词前缀; S5、自然语言预测:将语义对齐后的数据与提示词输入冻结参数的大语言模型,输出自然语言预测结果; S6、输出投影:通过线性投影将自然语言响应反解析为数值化发电预测值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院,其通讯地址为:518071 广东省深圳市南山区桃源街道丽水路2279号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。