Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国地质大学(武汉)曾德泽获国家专利权

中国地质大学(武汉)曾德泽获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国地质大学(武汉)申请的专利一种大模型KV精度无损压缩方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121547056B

龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610079573.0,技术领域涉及:H03M7/30;该发明授权一种大模型KV精度无损压缩方法及系统是由曾德泽;肖雨昊;李哲雄;田厉锋设计研发完成,并于2026-01-21向国家知识产权局提交的专利申请。

一种大模型KV精度无损压缩方法及系统在说明书摘要公布了:本申请提供了一种大模型KV精度无损压缩方法及系统,涉及数据处理领域,方法包括:获取大语言模型推理过程中产生的键值缓存数据;对键值缓存数据进行高维特征提取与相似度分析,生成对应的哈希签名;基于哈希签名,对键值缓存数据进行物理重排序,使得特征相似的键值缓存数据在物理存储空间上相邻排列;将重排序后的键值缓存数据通过高速互联接口传输至智能网卡;通过智能网卡调用其集成的硬件无损压缩模块,对重排序后的键值缓存数据进行流式压缩。本申请的技术方案利用硬件卸载与流水线技术,显著降低了传输带宽占用与系统整体延迟,为大模型在资源受限的边缘环境中实现高效推理提供了关键技术支撑。

本发明授权一种大模型KV精度无损压缩方法及系统在权利要求书中公布了:1.一种大模型KV精度无损压缩方法,其特征在于,方法包括以下步骤: S1:获取大语言模型推理过程中产生的键值缓存数据; S2:对键值缓存数据进行高维特征提取与相似度分析,生成对应的哈希签名; 步骤S2包括: 所述对键值缓存数据进行高维特征提取与相似度分析,生成对应的哈希签名,具体包括: 将键值缓存数据展平为二维矩阵,其中每一行代表一个键值向量; 采用局部敏感哈希算法,为每个键值向量计算固定长度的哈希签名; 其中,所述局部敏感哈希算法为相似度哈希算法,其通过将键值向量与一个预生成的随机超平面矩阵进行点积运算,并根据运算结果的符号位生成哈希签名; 所述随机超平面矩阵在初始化时采用固定的随机种子生成; 所述哈希签名的长度为64位; S3:基于哈希签名,对键值缓存数据进行物理重排序,使得语义特征相似的键值缓存数据在物理存储空间上相邻排列; S4:将重排序后的键值缓存数据通过高速互联接口传输至智能网卡;步骤S4包括: 所述智能网卡为集成有硬件压缩加速功能的协处理器; S5:通过智能网卡调用其集成的硬件无损压缩模块,对重排序后的键值缓存数据进行流式压缩; 步骤S5包括: 所述智能网卡调用其集成的硬件无损压缩模块进行流式压缩,具体包括: 将待压缩的键值缓存数据按固定大小进行分块,得到数据分块; 为每个数据分块创建输入与输出缓冲区; 通过异步任务提交方式,将数据分块依次提交至智能网卡的硬件压缩引擎,得到压缩块; 硬件压缩引擎处理采用标准DEFLATE无损压缩算法,并结合智能网卡硬件加速模块实现高速流式执行; DEFLATE算法由LZ77滑动窗口匹配模块与哈夫曼熵编码模块两部分组成;LZ77滑动窗口匹配模块用于扫描数据分块的字节序列,确定历史出现的相同或相似大于预设阈值的数据并去除;哈夫曼熵编码模块用于对数据分块的符号进行熵编码,将高频符号分配短码,低频符号分配长码; 将每个压缩块的首尾分别自动插入与压缩格式兼容的头部字段以及基于校验和算法的尾部校验字段,用于判断当前分块位置是否为首个或最后一个数据分块,触发相应的头尾数据写入操作; 在硬件压缩引擎处理当前数据分块的同时,并行加载下一个待压缩的数据分块; 所述硬件压缩引擎还包括上下文自愈机制,当检测到压缩上下文处于空闲状态或发生执行异常时,自动执行上下文重启操作,重新激活硬件压缩引擎并从最近成功处理的数据分块继续压缩。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国地质大学(武汉),其通讯地址为:430000 湖北省武汉市洪山区鲁磨路388号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。