Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种神经网络处理器,应用于人工智能领域,该神经网络处理器包括:脉动阵列、乘法累加器阵列、处理调度器、数据派遣器及存储器。本发明提供了一种混合SA/MAC阵列协同架构,通过处理调度器动态分配任务,解决了单独脉动阵列或乘法累加器阵列...
  • 本公开涉及一种基于三维存储阵列的权重存储方法、系统、介质,通过片下对模型权重预训练得到预训练权重,将预训练权重写入到三维存储阵列的第一存储层,基于模型权重得到第一低秩矩阵和第二低秩矩阵,第一低秩矩阵和第二低秩矩阵是微调权重的分解矩阵,通过位...
  • 本申请属于人工智能技术领域,具体公开了一种基于AIST忆阻器的跨模态伤害感知联想记忆电路,包括伤害感知模块,用于将触觉、视觉和听觉的多模态伤害信号转换为相应的脉冲电压信号;联想学习模块,用于通过忆阻器模拟突触可塑性,强化跨模态信号的关联性记...
  • 本发明公开了一种支持混合精度计算的人工智能算法推理加速方法、加速器和设备,属于集成电路技术领域;该方法首先将获取的数据块进行分批次处理缓冲,对于在DRAM中存储的多精度数据能够通过批次定位、线程定位以及多精度划分完成特征图到计算线程计算块的...
  • 本申请提供一种扩散模型的量化方法及系统,其中,方法,包括:获取预训练的扩散模型的校准数据;根据预训练的扩散模型的校准数据,对预训练的扩散模型的激活通道进行重排序,确定预训练的扩散模型的量化层参数;依次固定激活值参数和权重参数,最小化权重参数...
  • 本发明公开了一种面向扩散模型并行推理的通信压缩方法,包括如下步骤:S1、预热初始化,前N个时间步传输完整激活值,第N步时发送方与接收方存储当前激活值作为初始基准值;S2、残差压缩与传输,从第N+1步起,发送方计算当前激活值与上一步基准值的残...
  • 本发明公开了一种基于Wav2Lip数字人模型的量化部署方法,具体涉及到人工智能模型的优化和部署领域。本发明使用静态量化将Wav2Lip模型由FP32格式转为INT8格式存储,通过层次化量化,在自定义卷积和反卷积模块内部及输出块重构时插入量化...
  • 本申请公开了存算一体装置、存算方法、处理装置、瓦片模块及加速器,涉及电子电路技术领域,包括:每个存算一体阵列实现阵列内并行计算,存算一体阵列可同时对当前周期缓存中每个时刻的单比特输入脉冲与对应权重执行乘法运算,同步生成各时刻的膜电位增量值,...
  • 本发明涉及一种边缘端脉冲神经网络压缩与部署方法及系统,属于机器学习技术领域,边缘端脉冲神经网络压缩与部署方法,基于获取的多模态数据对初始脉冲神经网络模型进行前向传播,其中,基于硬件感知初始化获得前向传播过程中内存使用状态,基于内存使用状态对...
  • 本发明公开了一种基于脑区和拓扑的脉冲神经网络划分映射方法及装置,本发明方法包括获取被模拟脉冲神经网络的所有脑区数据及指定进程数;确定脑区总内存开销;若脑区总内存开销不大于指定进程数的内存容量则计算出各个脑区的最小分配进程数、负载并分配指定进...
  • 描述了一种在深度神经网络中利用激活稀疏性的方法。该方法包括检索激活张量和权重张量,其中该激活张量是稀疏激活张量。该方法还包括生成包含该激活张量的非零激活的经压缩激活张量,其中该经压缩激活张量具有比该激活张量少的列。该方法进一步包括对该经压缩...
  • 本公开提供了一种模型处理方法及装置、网络节点、系统、设备及存储介质中,第一网络节点包括第一处理模块,第一处理模块中包含第一模型,第一模型的目标参数确定方式可以根据第一网络节点的资源利用信息,从多个参数确定方式中确定得到,第一模型的参数可以通...
  • 本发明涉及深度学习与矿山压力预测技术领域,具体公开了一种基于TCN‑GRU融合时空注意力机制的工作面矿压动态预测方法。本发明通过分布式光纤传感网络实时采集工作面多源矿压时序数据,并对数据进行预处理;构建TCN‑GRU‑Attention预测...
  • 本申请涉及一种深度学习模型推理方法、装置、计算机设备和存储介质。所述方法包括:调用与国产加速器相适配的推理框架,对深度学习模型进行编译优化、并行优化、内存层次优化和计算加速部件的深度融合,得到目标优化模型;将所述目标优化模型编译为所述国产加...
  • 本发明涉及一种适用于微处理器的深度学习模型结构,包括一种块内双DP扩张与收缩结构,所述的块内双DP扩张与收缩结构包括第一深度卷积层、第一点卷积层、第二深度卷积层、第二点卷积层,所述的第一深度卷积层的输出端与第一点卷积层相连,所述的第一点卷积...
  • 本发明提供一种以深度卷积和点卷积融合计算提升网络效率的方法,包括:S1,通过深度卷积参数计算输出宽高out_h和out_w;S2,循环out_h*out_w;S3,循环点卷积输出通道out_c;S4,循环深度卷积的输出通道c;在深度卷积输出...
  • 本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于双重掩码稀疏注意力的处理方法、装置、设备及介质,包括:获取输入数据,将输入数据划分为多个数据块,获得数据块嵌入向量;生成用于约束数据块之间静态连接关系的结构化...
  • 本申请公开了一种多维度协同决策方法及系统,涉及多维度信息下的协同决策、大模型技术,包括:采集环境观测信息,以及,获取协同者的行为轨迹信息;结合所述环境观测信息和所述行为轨迹信息,并编码生成文本化的状态信息;根据所述状态信息、所述行为轨迹信息...
  • 本公开涉及神经网络模型技术领域,特别是一种轻量化模型的更新方法、设备及介质,方法包括:对Transformer模型进行更新,出现错误输出时,判断该错误输出的错误类型是否存在对应的错误标记:若不存在,对该错误类型生成错误标记,并冻结Trans...
  • 本发明公开一种Active‑Bit编码的快速解码方法。键值缓存压缩是一种用于优化大型语言模型在推理过程中的内存使用和计算效率的技术。随着序列长度的增加,键值缓存会线性增长,导致显著的内存消耗和计算复杂度。有一种简单又有效的数据压缩技术为Ac...
技术分类