Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明属于机器学习领域,更具体地涉及一种平衡感知的图神经网络训练方法。本发明针对现有图神经网络在不平衡图数据下,少数类节点信息稀缺而面临性能下降的问题,首先设计了一种混合监督学习方法,生成两个平衡感知视图,通过对比学习增强少数类的节点嵌入。...
  • 本申请公开了一种多模态大模型的构建方法、装置、电子设备和存储介质,该方法和装置应用于电子设备,具体为基于分类模型对采集的大量数据进行分类处理,得到每个数据的数据类型;基于智能融合模型对大量数据及其数据类型进行判断,得到用于基于大量数据进行模...
  • 本发明公开一种基于鲁棒主动学习的噪声网络对齐方法及系统,属于网络对齐技术领域。所述方法包括:基于节点对的清洁度分数csij、网络对齐模型的预测置信度和标注器置信度Corc,计算该节点对的置信度Cij;根据该置信度Cij选择最有价值的节点对;...
  • 本发明公开了一种基于强化学习的类别均衡图神经网络快速主动学习方法,其包括:基于一个带全部标签的图数据作为训练图数据,针对图神经网络(GNN)分类器模型,基于强化学习方法训练一个类别均衡的批量图主动学习策略;将学习到的最优批量主动学习策略,直...
  • 近年来,强化学习在多领域成效显著,但传统方法在动态环境或多任务情境中适应性有限。本文提出了一种名为优先级加权软模块化方法(soft modularization with priority‑weighted knowledge distil...
  • 本说明书实施例提供一种大语言模型的强化学习训练方法及装置,该方法包括:将第一输入文本输入大语言模型,以使大语言模型基于其当前策略处理第一输入文本,得到G个输出文本;将G个输出文本分别与第一输入文本组合,将组合的结果分别输入已训练的奖励模型,...
  • 本发明涉及一种基于语言模型的多智能体多任务序列决策方法和系统,通过将多智能体、多任务决策重构为对话式序列建模,解决强化学习方法扩展到多任务场景时输入表征不匹配的挑战,并在无需奖励监督或在线交互的情况下提升分布外行为的鲁棒性,增强了模型的泛化...
  • 本发明涉及一种基于通用多智能体并行强化学习框架的虚实迁移方法,包括如下步骤:搭建与任务适配的并行仿真环境,加载任务所需的智能体模型,随机初始化环境参数及智能体状态;训练阶段,加载多智能体强化学习算法,智能体从仿真环境获取局部观测信息,将局部...
  • 本发明涉及人工智能技术领域,具体为一种基于低碳贡献反馈的强化学习绿色大模型训练方法,包括:构建由神经网络嵌入模型编码的知识向量库;利用第一神经网络大语言模型、检索增强及专家规则构建低碳贡献评价函数并生成奖励信号;采用强化学习算法根据该奖励信...
  • 本发明涉及大模型训练技术领域,公开了视觉词汇引导的多模态大模型幻觉优化方法及存储介质,构建包括图像、文本提示、优选回答与拒选回答的训练样本,使用视觉目标检测模型依据优选回答对图像进行图像检测,提取与视觉词一致性的相关指标,并据此计算每个视觉...
  • 本发明公开了一种基于强化学习的数字形象动作动态调整方法,包括采集用户与数字形象之间的多源交互数据,进行语义解析,生成语义子目标向量;根据评分值构建改进型层级强化学习结构,生成子目标意图嵌入向量,输入风格调控器与低层动作策略网络,输出动作轨迹...
  • 本发明公开了一种基于SAGAN和微调的联邦学习后门攻击防御方法及系统。方法,包括如下步骤:步骤S1:通过SAGAN生成伪数据;步骤S2:清洗伪数据,构造微调数据集;步骤S3:微调全局模型;步骤S4:动态调整正则项权重;步骤S5:梯度计算与参...
  • 本发明涉及一种基于门控交互提示的视觉‑语言模型的参数微调方法,属于多模态模型适配技术领域,本发明通过将可学习的提示插入到预训练视觉‑语言模型的注意力层中,并引入任务特异性的门控机制,动态调节提示对不同任务的影响。本发明不仅促进了视觉与文本表...
  • 本发明公开了一种基于强化学习的多源域多教师知识蒸馏方法及系统,所述方法包括:获取目标域样本数据,将数据输入至N个预训练教师模型,生成各教师模型的输出特征;将目标域样本及所有教师模型输出输入强化学习策略网络,生成各教师模型的动态权重,基于动态...
  • 本公开提供了一种处理方法,包括:获取第一模型和第二模型,第二模型为第一模型经过语义蒸馏得到的,第一模型或第二模型用于对非结构化输入数据中的语义信息进行识别;基于第一损失对第二模型进行多次第一训练,获得第一中间模型,用于计算第一损失的第一损失...
  • 本发明公开了一种基于知识同化的大规模无人机集群协同对抗迁移强化学习方法,属于无人机集群迁移强化学习领域。无人机的决策模型由深度Q网络和Transformer编码器组成,其中深度Q网络负责无人机的自主强化学习过程,Transformer编码器...
  • 本发明涉及机器学习技术领域,具体涉及一种基于视图对齐的知识蒸馏方法及系统。旨在解决传统蒸馏技术中存在的主要局限性,包括教师模型过度自信和确认偏差等问题。本发明提出了一种基于对数几率的新型知识蒸馏框架,称为KDVA;具体而言,本发明首先对模型...
  • 本发明涉及人工智能技术领域,具体涉及面向多模态大模型的知识蒸馏加速方法及系统,包括:获取多模态输入数据;执行拓扑保持的特征映射,构建多模态特征空间的拓扑表示,基于残差模块设计特征映射模块;应用拓扑层次化注意力机制,通过局部拓扑注意力单元和全...
  • 本发明公开了一种用于创建及矫正大模型微调数据集的方法,涉及大模型技术领域;该方法包括:将接收到的结构化与非结构化文本转化为统一格式的结构化内容单元;利用以预训练大语言模型为核心的教师模型,生成并蒸馏出初始问答对;依据包含相关性、准确性及完整...
  • 本发明提供面向多任务的变分自编码低秩适配器优化方法,包括选择预训练的模型作为基座模型并进行权重矩阵的初始化;明确若干训练任务,并确定训练任务的训练数据集;初始化若干低秩适配器模块、变分自编码器和动态路由器的参数;将训练数据集经过预处理后得到...
技术分类