买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本公开的实施方式提供了一种基于频域变换的词向量压缩方法。该方法包括:将待压缩的词向量进行傅里叶变换,得到与所述词向量对应的频域向量;计算所述频域向量中各个元素的模值,并基于所述模值的数值大小对所述频域向量中的元素进行排序;从排序后的所述频域向量中选取若干元素,并基于所述选取出的若干元素构建压缩后的词向量。通过以上技术方案,既不改变词向量原有的表达能力,又可以按词向量各元素的重要性进行排序,因此,不仅能够处理高度非线性分布的语言中的词汇,还可以去除不重要的元素,仅保留代表词向量中关键信息的元素,从而实现对词向量的压缩,降低了词向量的维护成本。
主权项:1.一种基于频域变换的词向量压缩方法,包括:将待压缩的词向量进行傅里叶变换,得到与所述词向量对应的频域向量;计算所述频域向量中各个元素的模值,并基于所述模值的数值大小对所述频域向量中的元素进行排序;当排序策略为所述模值的数值从大到小排序时,选取排序结果中靠前的若干元素;基于所述选取出的若干元素构建压缩后的词向量,包括:将所述若干元素对应的位置信息,以及所述若干元素的模值分别作为新的元素,基于所述若干元素的排序,构建出所述压缩后的词向量;获取所述若干元素在排序前的频域向量中对应的位置信息,所述位置信息包括所述若干元素在排序前的频域向量中对应的位置信息的倒数。
全文数据:
权利要求:
百度查询: 杭州网易智企科技有限公司 一种基于频域变换的词向量压缩方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。