Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例提供一种在计算设备集群中分布式训练神经网络模型的方法,计算节点和计算设备集群,计算节点的计算单元在前向计算和反向计算之前可以通过节点内通信获取各网络层权重系数,无需跨节点通信,由此减少了全局通信次数,能够提高训练模型效率。该方法...
  • 本发明涉及一种基于鲁棒测试时自适应的视觉语言模型优化方法,属于人工智能技术领域。该方法解决零样本场景下因提示敏感性和领域适应性不足导致的模型性能下降问题,其中提示微小变动引发分类波动,数据分布偏移削弱跨领域泛化能力。技术方案通过四步闭环实现...
  • 本申请提供了一种应答模型的微调方法、装置、电子设备及存储介质,属于计算机技术领域,用以在耗时较短的情况下生成准确的应答结果。该方法包括:根据第一训练集,对初始应答模型进行训练,得到显式推理应答模型;第一训练集中包含推理数据;显式推理应答模型...
  • 本申请公开了一种基于模型训练的数据处理方法、装置、设备及可读存储介质,方法包括:获取N个教师模型,每个教师模型用于处理一种媒体资源理解任务,N为大于1的整数;获取N个教师模型训练所用的N个任务数据集,并获取多种媒体资源理解任务下的多任务数据...
  • 本申请公开了一种客服模型训练方法、装置、系统及非易失性存储介质。其中,该方法包括:获取训练数据集;将训练数据集划分为第一训练数据集和第二训练数据集;将第一训练数据集和校正后的第一标注信息作为第一校正训练数据集对教师模型进行训练,并使用训练后...
  • 本发明公开了一种基于预训练多模态大模型的跨模态表示学习方法,其通过教师模型和学生模型对输入数据在不同尺度上进行特征提取,结合对比蒸馏、特征蒸馏、相似性蒸馏和硬负样本蒸馏对学生模型进行知识提炼;再根据不同蒸馏方法的损失动态调整权重,优化蒸馏过...
  • 公开了一种数据处理方法、系统、芯片、计算机设备及集群,涉及人工智能领域。根据训练人工智能模型得到的多个任务的损失确定多个任务的参数更新;基于多个任务的参数更新搜索模型参数的优化方式,更新模型参数。进而,基于用于预测多个任务的人工智能模型处理...
  • 本发明涉及图像识别技术领域,具体为一种空中机器人分层强化学习控制方法,包括建立环境状态模型,根据环境参数将路面标线检测任务分解三个控制层次,分别设置区域级奖励函数、航迹级奖励函数和像素级奖励函数,其中区域级奖励函数评估目标路段覆盖完整性,航...
  • 本公开涉及人工智能技术领域,提供了一种强化学习模型的训练方法、装置、设备及介质,获取智能体采用待训练的强化学习模型所提供的历史策略与环境进行交互的经验数据,再利用经验数据确定待训练的强化学习模型在历史策略与当前策略之间的原始动作概率比,根据...
  • 本发明涉及物流与供应链管理技术领域,具体为一种PER‑自适应探索深度强化学习TSP/CVRP优化方法,包括以下步骤:S1、构建包含节点特征、车辆状态及循环神经网络隐藏状态的状态空间,定义选择下一跳节点的离散动作空间;S2、利用循环神经网络编...
  • 本发明属于机器学习领域,提供一种基于潜在空间扩散的模仿学习方法、系统及存储介质。本发明在扩散建模中引入了潜在空间扩散机制,有效减少了扩散模型在原始高维状态空间中运行所带来的计算负担,显著降低了训练时间与显存消耗, 提升了训练的稳定性。同时,...
  • 本发明涉及深度学习技术,揭露了一种基于流匹配与动态奖励调度的模仿学习方法,包括:获取专家演示轨迹,并利用流匹配模型提取专家演示轨迹中专家特征序列;获取智能体策略网络执行任务的策略状态序列并转换为策略特征;利用专家特征序列和策略特征构造奖励函...
  • 本申请提供一种AI大模型强化学习超参数动态调整的方法及装置,涉及人工智能技术领域,包括:获取AI大模型在训练过程中第一时间窗口下的第一性能评估值和以及第二时间窗口下的第二性能评估值;根据第一性能评估值和第二性能评估值的差值,确定AI大模型从...
  • 本发明提出了基于超网络的分层值分解的异构多智能体协同方法,该方法结合了超策略网络和分层值分解机制,能够动态生成智能体的策略网络参数,并根据智能体的类型和历史观测提取类型特征,从而实现更精确的值分解和策略优化。针对异构智能体直接通过显式分层机...
  • 本发明涉及人工智能技术领域,特别是涉及面向个性化推荐的深度学习强化学习系统及方法,包含用户操作数据存储模块存储历史操作数据,预处理模块对其进行处理,嵌入模块将处理后的数据转化为用户和物品的低维向量,强化学习决策模块是核心,其双网络结构单元构...
  • 本申请公开了一种AI模型训练方法、AI模型使用方法、计算机设备及存储介质,所述方法包括:获取策略库,并根据所述策略库中的场景初始化运行环境;基于统一AI模型,控制多个智能体在所述运行环境中进行对弈,得到训练样本,其中,所述训练样本包括场景分...
  • 本申请提供了一种模型训练方法、装置、计算机设备、计算机可读存储介质及计算机程序产品;本申请实施例可应用于游戏、人工智能、智慧交通、辅助驾驶等各种场景,方法包括:在游戏对局中,获取第一智能体的状态数据和第一智能体对应的待训练的第一预测模型;利...
  • 本发明公开了一种基于Rolling‑WMA‑GRU算法的风速滚动预测方法及系统,方法如下:S1.获取待预测区域历史风速序列,利用该风速序列构造监督训练数据集,将该数据集拆分为训练集1和训练集2;S2.搭建可变参数的GRU网络,将训练集1中的...
  • 本申请公开了一种迭代式监督微调数据生成方法及系统,涉及人工智能、数据处理技术,包括:基于预训练语言模型生成基础训练数据对,所述基础训练数据对包括指令‑响应对;基于基础训练数据对进行模型训练,并根据模型在验证集及任务指标上的表现,确定训练性能...
  • 本公开涉及使用对比学习训练神经网络,具体公开了使用神经网络对与日志相关联的至少一个向量进行编码的方法、系统和机器可读介质。在至少一个实施例中,神经网络至少部分地通过以下步骤进行训练:通过对与第一日志序列相关联的第一向量、与和第一日志序列相似...
技术分类