Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及一种基于通用多智能体并行强化学习框架的虚实迁移方法,包括如下步骤:搭建与任务适配的并行仿真环境,加载任务所需的智能体模型,随机初始化环境参数及智能体状态;训练阶段,加载多智能体强化学习算法,智能体从仿真环境获取局部观测信息,将局部...
  • 本发明涉及一种基于语言模型的多智能体多任务序列决策方法和系统,通过将多智能体、多任务决策重构为对话式序列建模,解决强化学习方法扩展到多任务场景时输入表征不匹配的挑战,并在无需奖励监督或在线交互的情况下提升分布外行为的鲁棒性,增强了模型的泛化...
  • 本说明书实施例提供一种大语言模型的强化学习训练方法及装置,该方法包括:将第一输入文本输入大语言模型,以使大语言模型基于其当前策略处理第一输入文本,得到G个输出文本;将G个输出文本分别与第一输入文本组合,将组合的结果分别输入已训练的奖励模型,...
  • 近年来,强化学习在多领域成效显著,但传统方法在动态环境或多任务情境中适应性有限。本文提出了一种名为优先级加权软模块化方法(soft modularization with priority‑weighted knowledge distil...
  • 本发明公开了一种基于强化学习的类别均衡图神经网络快速主动学习方法,其包括:基于一个带全部标签的图数据作为训练图数据,针对图神经网络(GNN)分类器模型,基于强化学习方法训练一个类别均衡的批量图主动学习策略;将学习到的最优批量主动学习策略,直...
  • 本发明公开一种基于鲁棒主动学习的噪声网络对齐方法及系统,属于网络对齐技术领域。所述方法包括:基于节点对的清洁度分数csij、网络对齐模型的预测置信度和标注器置信度Corc,计算该节点对的置信度Cij;根据该置信度Cij选择最有价值的节点对;...
  • 本申请公开了一种多模态大模型的构建方法、装置、电子设备和存储介质,该方法和装置应用于电子设备,具体为基于分类模型对采集的大量数据进行分类处理,得到每个数据的数据类型;基于智能融合模型对大量数据及其数据类型进行判断,得到用于基于大量数据进行模...
  • 本发明属于机器学习领域,更具体地涉及一种平衡感知的图神经网络训练方法。本发明针对现有图神经网络在不平衡图数据下,少数类节点信息稀缺而面临性能下降的问题,首先设计了一种混合监督学习方法,生成两个平衡感知视图,通过对比学习增强少数类的节点嵌入。...
  • 本发明提供了一种针对空冷PEMFC的半经验模型参数寻优方法和系统,属于燃料电池模型优化技术领域,包括将目标空冷PEMFC的多组操作条件输入参数预测模型,输出对应的空冷PEMFC半经验模型的多个预测参数;每组操作条件均包括空冷PEMFC运行时...
  • 本申请公开了一种增汽机运行性能预测方法、装置、设备、介质及产品,涉及增汽机性能预测技术领域,该方法包括:将待预测运行数据输入增汽机运行性能预测模型,得到预测结果;增汽机运行性能预测模型的训练步骤包括:获取增汽机的历史运行数据和对应的引射比数...
  • 本发明涉及人工智能技术领域,公开了一种大模型的构建方法、装置、设备及介质,方法包括将目标模型的Transformer权重矩阵进行分块处理,以形成多个子矩阵;将每个子矩阵通过二维Kronecker分解进行低秩近似,得到每个子矩阵分别对应的两个...
  • 本发明属于低空经济技术领域,具体涉及一种基于自适应分层软滤波器剪枝的低空无人机模型压缩方法,该方法具体过程为:步骤1:层剪枝比计算:计算低空无人机神经网络模型每一卷积层的重要性值,根据所述重要性值确定与其呈负相关的层剪枝比;步骤2:滤波器剪...
  • 本发明提出了一种适用于自回归掩码生成模型的后训练量化方法——Q‑MAR(Quantization for Masked Autoregressive Models),该方法创新性地设计了两个模块:分层聚类解耦模块(Hierarchical ...
  • 本发明公开了一种用于目标价值与瞬变威胁评估的评估网络模型训练方法,获取用于进行目标价值与瞬变威胁评估的训练数据集和预先构建的深度残差网络模型;基于训练数据集和预先构建的改进萤火虫群优化算法对深度残差网络模型的初始模型参数值进行迭代优化,得到...
  • 本申请公开了一种目标检测模型的确定方法、装置及存储介质,所述方法包括:获取多媒体资源以及初始检测模型;对初始检测模型中的每个初始网络层进行压缩处理,得到与每个初始网络层对应的每个压缩网络层,并根据每个压缩网络层,生成当前压缩模型;将多媒体资...
  • 本公开提供了一种转换模型的训练方法、数据查询方法、装置及电子设备,涉及计算机技术领域,尤其涉及人工智能、大模型、大数据处理、数据库管理、信息检索、自然语言处理等技术领域。具体实现方案为:基于查询语句样本和N个查询字段标识,构建提示词样本;其...
  • 本申请公开了一种网络训练方法、模态预测方法及相关设备和介质,该网络训练方法用于对几何深度学习网络进行训练,该网络训练方法包括:获取目标部件的第一样本数据,第一样本数据包括目标部件的样本有限元模型、样本非可视化参数以及相应的样本模态真实结果;...
  • 一种训练方法,在一或多个回合的各时间步中所述方法包含下列步骤。由稀疏智能体根据状态产生动作。自经验回放池获取候选样本,以更新稀疏智能体的当前神经网络,并且其中更新当前神经网络的步骤包含下列步骤。根据候选样本,计算损失函数。根据损失函数,计算...
  • 本发明属于光学神经网络计算技术领域,具体为一种基于片上衍射神经网络的智能后处理系统。本发明借助片上衍射神经网络对通信系统的光信号进行实时后处理,包括三个模块:将一维信息按照时间顺序导入片上衍射区域的信号处理模块、通过对输入光信号进行相位调制...
  • 本发明提供了一种基于全印刷电化学晶体管的高保真神经元电路,包括放大单元、复位OECT、膜电容元件、反馈电容元件、电流输入端、电压源VDD以及公共接地端GND,放大单元中的第一级OECT的栅极与膜电容元件的一端连接,在连接节点处与电流输入端连...
技术分类