买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天津车之家软件有限公司
摘要:本发明属于蒸馏技术领域,且公开了一种基于知识蒸馏技术的相关性搜索优化方法,该优化方法步骤如下:S1,数据准备:数据准备包括数据采集、数据清洗和数据标注三部分构成;S2,基于交互的模型:基于交互的模型是将输入文本输入到BERT编码器中,生成文本表示向量;S3,基于表示的模型:基于表示的模型是将两个输入文本分别输入到两个BERT编码器中。本发明通过此创新方案在商业与工程领域均展现出显著优势,从商业视角看,其核心价值在于方法的高度简效与可复制性,能够以较低的工程成本投入;工程层面,本方案通过模型压缩技术,将庞大复杂的预训练模型精炼为紧凑高效的小型模型,大幅削减计算负担与存储需求,同时保持或仅轻微牺牲模型性能。
主权项:1.一种基于知识蒸馏技术的相关性搜索优化方法,其特征在于:该优化方法步骤如下:S1,数据准备:数据准备包括数据采集、数据清洗和数据标注三部分构成;S2,基于交互的模型:基于交互的模型是将输入文本输入到BERT编码器中,生成文本表示向量;S3,基于表示的模型:基于表示的模型是将两个输入文本分别输入到两个BERT编码器中,生成两个文本表示向量;S4,基于交互的模型得到基于表示模型的知识蒸馏:基于表示的模型已成为高效文本匹配的主流技术;S5,基于交互的模型自蒸馏:基于规则样本预训练一个12层的交互大模型,然后使用人工标注的样本对交互大模型进行finetune,随后从第一步训练得到的12层教师模型中抽取前两层,然后使用第一步中得到的包含教师模型知识的语料对这两层模型进行预训练。
全文数据:
权利要求:
百度查询: 天津车之家软件有限公司 一种基于知识蒸馏技术的相关性搜索优化方法及应用系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。