Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及人工智能模型优化技术领域,公开了一种生成式AI模型的多粒度动态剪枝方法及系统。该系统包括模型状态采集模块,通过探针实时获取中间层输出,构建神经元激活分布、权重矩阵范数及连接拓扑的特征信息集;稀疏度评估模块基于特征信息集、初始稀疏度...
  • 一种缓解神经网络灾难性遗忘问题的动态结构方法,包含有以下步骤:S1、对神经网络学习训练样本数据进行归一化;S2、构造神经元连接权值记忆数组;S3、构造神经元偏置量记忆矩阵;S4、根据神经网络输入动态选择各层神经元之间连接权值;S5、根据神经...
  • 本申请涉及智慧交通技术领域,尤其涉及一种车辆轨迹补帧模型的训练方法和系统,包括:基于多个经遮挡处理后的历史轨迹数据对预训练的Transformer网络进行训练,获得训练完成的车辆轨迹补帧模型;训练过程包括如下步骤:获取每一被遮挡的时间步对应...
  • 本发明公开了一种用于设施葡萄光合速率预测的神经网络优化方法,属于人工智能与农业交叉领域。为解决神经网络随机初始化易陷入局部最优的问题,本方法在训练前,采用结合模拟退火算法的群体智能优化算法进行全局寻优,以确定最优的初始连接权值和节点阈值。该...
  • 本发明公开了一种基于混合遗传算法的私有生成式大模型优化系统,属于人工智能技术领域,要解决的技术问题为:如何压缩模型规模、简化特征维度以提升推理效率,同时尽量保持模型精度。包括包括多源异构数据微调模块、大模型构建模块、混合遗传算法优化模块、扩...
  • 本公开涉及使用对比学习训练神经网络,具体公开了使用神经网络对与日志相关联的至少一个向量进行编码的方法、系统和机器可读介质。在至少一个实施例中,神经网络至少部分地通过以下步骤进行训练:通过对与第一日志序列相关联的第一向量、与和第一日志序列相似...
  • 本申请公开了一种迭代式监督微调数据生成方法及系统,涉及人工智能、数据处理技术,包括:基于预训练语言模型生成基础训练数据对,所述基础训练数据对包括指令‑响应对;基于基础训练数据对进行模型训练,并根据模型在验证集及任务指标上的表现,确定训练性能...
  • 本发明公开了一种基于Rolling‑WMA‑GRU算法的风速滚动预测方法及系统,方法如下:S1.获取待预测区域历史风速序列,利用该风速序列构造监督训练数据集,将该数据集拆分为训练集1和训练集2;S2.搭建可变参数的GRU网络,将训练集1中的...
  • 本申请提供了一种模型训练方法、装置、计算机设备、计算机可读存储介质及计算机程序产品;本申请实施例可应用于游戏、人工智能、智慧交通、辅助驾驶等各种场景,方法包括:在游戏对局中,获取第一智能体的状态数据和第一智能体对应的待训练的第一预测模型;利...
  • 本申请公开了一种AI模型训练方法、AI模型使用方法、计算机设备及存储介质,所述方法包括:获取策略库,并根据所述策略库中的场景初始化运行环境;基于统一AI模型,控制多个智能体在所述运行环境中进行对弈,得到训练样本,其中,所述训练样本包括场景分...
  • 本发明涉及人工智能技术领域,特别是涉及面向个性化推荐的深度学习强化学习系统及方法,包含用户操作数据存储模块存储历史操作数据,预处理模块对其进行处理,嵌入模块将处理后的数据转化为用户和物品的低维向量,强化学习决策模块是核心,其双网络结构单元构...
  • 本发明提出了基于超网络的分层值分解的异构多智能体协同方法,该方法结合了超策略网络和分层值分解机制,能够动态生成智能体的策略网络参数,并根据智能体的类型和历史观测提取类型特征,从而实现更精确的值分解和策略优化。针对异构智能体直接通过显式分层机...
  • 本申请提供一种AI大模型强化学习超参数动态调整的方法及装置,涉及人工智能技术领域,包括:获取AI大模型在训练过程中第一时间窗口下的第一性能评估值和以及第二时间窗口下的第二性能评估值;根据第一性能评估值和第二性能评估值的差值,确定AI大模型从...
  • 本发明涉及深度学习技术,揭露了一种基于流匹配与动态奖励调度的模仿学习方法,包括:获取专家演示轨迹,并利用流匹配模型提取专家演示轨迹中专家特征序列;获取智能体策略网络执行任务的策略状态序列并转换为策略特征;利用专家特征序列和策略特征构造奖励函...
  • 本发明属于机器学习领域,提供一种基于潜在空间扩散的模仿学习方法、系统及存储介质。本发明在扩散建模中引入了潜在空间扩散机制,有效减少了扩散模型在原始高维状态空间中运行所带来的计算负担,显著降低了训练时间与显存消耗, 提升了训练的稳定性。同时,...
  • 本发明涉及物流与供应链管理技术领域,具体为一种PER‑自适应探索深度强化学习TSP/CVRP优化方法,包括以下步骤:S1、构建包含节点特征、车辆状态及循环神经网络隐藏状态的状态空间,定义选择下一跳节点的离散动作空间;S2、利用循环神经网络编...
  • 本公开涉及人工智能技术领域,提供了一种强化学习模型的训练方法、装置、设备及介质,获取智能体采用待训练的强化学习模型所提供的历史策略与环境进行交互的经验数据,再利用经验数据确定待训练的强化学习模型在历史策略与当前策略之间的原始动作概率比,根据...
  • 本发明涉及图像识别技术领域,具体为一种空中机器人分层强化学习控制方法,包括建立环境状态模型,根据环境参数将路面标线检测任务分解三个控制层次,分别设置区域级奖励函数、航迹级奖励函数和像素级奖励函数,其中区域级奖励函数评估目标路段覆盖完整性,航...
  • 公开了一种数据处理方法、系统、芯片、计算机设备及集群,涉及人工智能领域。根据训练人工智能模型得到的多个任务的损失确定多个任务的参数更新;基于多个任务的参数更新搜索模型参数的优化方式,更新模型参数。进而,基于用于预测多个任务的人工智能模型处理...
  • 本发明公开了一种基于预训练多模态大模型的跨模态表示学习方法,其通过教师模型和学生模型对输入数据在不同尺度上进行特征提取,结合对比蒸馏、特征蒸馏、相似性蒸馏和硬负样本蒸馏对学生模型进行知识提炼;再根据不同蒸馏方法的损失动态调整权重,优化蒸馏过...
技术分类