Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州高新区(滨江)区块链与数据安全研究院;浙江大学陈珂获国家专利权

杭州高新区(滨江)区块链与数据安全研究院;浙江大学陈珂获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州高新区(滨江)区块链与数据安全研究院;浙江大学申请的专利多标签文本数据集的蒸馏方法、装置、计算机设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120087449B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510572042.0,技术领域涉及:G06N3/096;该发明授权多标签文本数据集的蒸馏方法、装置、计算机设备和存储介质是由陈珂;谢钟乐;寿黎但;陈刚;骆歆远;王嘉豪设计研发完成,并于2025-05-06向国家知识产权局提交的专利申请。

多标签文本数据集的蒸馏方法、装置、计算机设备和存储介质在说明书摘要公布了:本申请涉及一种多标签文本数据集的蒸馏方法、装置、计算机设备和存储介质,其中,该方法包括:多标签文本数据集的蒸馏方法、装置、计算机设备和存储介质,通过获取原始数据集的第一文本嵌入向量和第一注意力标签的形状;原始数据集为多标签文本数据集;对第一注意力标签的形状进行剪枝,并根据剪枝结果和第一文本嵌入向量构建初始合成数据集;利用预设的内外循环机制,对初始合成数据集和原始数据集进行处理,得到目标合成数据集。通过本申请,解决了相关技术中存在少数类样本上表现欠佳,降低识别精度的问题;通过剪枝操作降低注意力标签的计算成本,还能捕捉到文本中的细粒度语义特征,从而提高数据集的可靠性。

本发明授权多标签文本数据集的蒸馏方法、装置、计算机设备和存储介质在权利要求书中公布了:1.一种多标签文本数据集的蒸馏方法,其特征在于,包括: 获取原始数据集的第一文本嵌入向量和第一注意力标签的形状;所述原始数据集为多标签文本数据集;所述第一注意力标签的形状为注意力机制中生成的权重矩阵或掩码的维度结构,具体形状取决于任务类型、输入数据结构和注意力类型;所述第一注意力标签的形状由所需合成数据集大小、Transformer层数、注意力头的数量和序列长度确定; 对所述第一注意力标签的形状进行剪枝,并根据剪枝结果和所述第一文本嵌入向量构建初始合成数据集;所述剪枝的依据为对所述注意力头的数量进行裁剪,以保留关键的注意力头; 利用预设的内外循环机制,对所述初始合成数据集和所述原始数据集进行处理,得到目标合成数据集。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州高新区(滨江)区块链与数据安全研究院;浙江大学,其通讯地址为:310051 浙江省杭州市滨江区物联网孵化器大楼2号楼A楼4-7层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。