该论文提出了一种使用少量基向量构建嵌入式编码、使用 Gumbel-softmax 技巧直接学习离散码表的自然语言处理模型压缩方法,并在情感分析和机器翻译任务中实现了 98% 的压缩率,从而达到在不影响性能的前提下减少内存占用的目的,该方法不需要改变网络结构且具有语言无关性。
Nov, 2017
对现代自然语言处理管道的核心构建块 —— 预训练词嵌入的稳定性进行深入研究,通过提出新的嵌入不稳定性度量来解释模型训练的不稳定性,并提出提高嵌入存储大小以达到降低不稳定性的稳定性 - 内存权衡。
Feb, 2020
我们对嵌入向量的压缩进行了全面的比较分析和实验评估,引入了一个新的分类法,并开发了一个模块化基准测试框架,评估了 14 种代表性方法,从而为不同内存预算下的使用情形推荐了最佳方法。此外,我们的研究还揭示了当前方法的局限性,并提出了未来研究的潜在方向。
Nov, 2023
该论文研究了使用词向量空间中的哈希技术压缩向量表达的内部结构对嵌入式表示存储优化的影响,同时探讨了二元分解对于嵌入式表示的可解释性的提高。
Nov, 2015
本研究提出一种深度学习模型的压缩方法,利用低秩矩阵因式分解来压缩自然语言处理中的字词嵌入层,经过实验证明可以在 90% 的压缩比下保持精度不受影响,并且在句子分类任务上表现优于其他方法,同时还引入了一种新的学习率调度算法 CALR,其在句子分类基准测试中表现出优越性。
Nov, 2018
本文对词嵌入进行了主成分分析,并提出了许多新颖且反直观的观察。研究人员进一步说明了方差解释率作为下游任务性能的代理效用,并通过对主嵌入空间的句法探测来展示主成分所捕捉的句法信息与其解释方差的数量不相关,从而调查了基于方差的嵌入后处理的局限性,并证明这种后处理在句子分类和机器翻译任务中是产生反效果的。最后,本文提供了一些关于应用基于方差的嵌入后处理的预防性准则,并解释了非各向同性几何可能是词嵌入性能的一部分的原因。
Oct, 2019
提出一种新型的多嵌入压缩方法 MEmCom,利用哈希和可训练权重分别构建两个嵌入表来同时实现对嵌入表的压缩和各实体对应独特嵌入的映射,该方法在多个问题类别上超过现有技术,并在压缩嵌入大小的同时实现与非压缩嵌入相近的区分能力。
Mar, 2022
本文提出一种基于随机投影与有限阶多项式拓展计算奇异值分解嵌入的压缩光谱嵌入算法,其降维效果与计算复杂度不受特征向量数量影响。此算法对聚类和分类等下游推断任务的对比相似度度量具有较好效果。
Sep, 2015
该研究旨在探究神经单词嵌入作为文件评级的证据源,并提出了一种双重嵌入空间模型(DESM),在 Bing 等商业 Web 搜索引擎中可以更好地对置顶文档进行重新排名。
Feb, 2016
通过提出量化点云普遍利用环境向量空间程度的新工具 IsoScore,该文挑战了诸多基于 NLP 文献存在问题的指标的结论。
Aug, 2021