本文介绍了一种使用 Tensor Train(TT)分解来压缩模型中的嵌入层的新方法,并在自然语言处理的广泛基准测试中评估了其性能与压缩比之间的平衡。
Jan, 2019
通过使用混合维度嵌入层架构,将嵌入向量的维度与其查询频率相匹配,可以显著降低内存使用,并同时提高机器学习性能,作者在 Criteo Kaggle 数据集上进行了实验验证。
Sep, 2019
我们对嵌入向量的压缩进行了全面的比较分析和实验评估,引入了一个新的分类法,并开发了一个模块化基准测试框架,评估了 14 种代表性方法,从而为不同内存预算下的使用情形推荐了最佳方法。此外,我们的研究还揭示了当前方法的局限性,并提出了未来研究的潜在方向。
Nov, 2023
提出一种新型的多嵌入压缩方法 MEmCom,利用哈希和可训练权重分别构建两个嵌入表来同时实现对嵌入表的压缩和各实体对应独特嵌入的映射,该方法在多个问题类别上超过现有技术,并在压缩嵌入大小的同时实现与非压缩嵌入相近的区分能力。
Mar, 2022
这项研究通过全面的基准测试过程,对轻量级嵌入式推荐系统(LERSs)的性能、效率和跨任务可转移性进行了调查,并提出了一种高效的嵌入式压缩方法,采用幅度剪枝,克服了现有复杂 LERSs 方法的竞争力,并揭示了 LERSs 在协同过滤和基于内容的推荐两个任务中的独特性能以及其有效性和普适性的启示。
Jun, 2024
推荐系统中的嵌入技术是关键,它将高维离散特征转化为低维连续向量以提升推荐性能,并涵盖协同过滤、自监督学习和基于图的技术,同时介绍了自动机器学习、哈希技术和量化技术,旨在改善推荐系统的性能和降低计算复杂性。
Oct, 2023
本文提出了一种压缩的序列推荐框架 CpRec,采用块状自适应分解和层间参数共享等技术来压缩神经网络,在真实世界的序列推荐数据集中表现出了较高的准确率和效率。
Apr, 2020
本文介绍了一种通过在 RNN 中的输入和输出嵌入层共享参数来压缩模型参数的方法,实验证明该方法可大幅减小模型参数的大小,但仍能在自然语言处理中保持模型的准确性和性能表现。
Nov, 2017
推荐系统领域的文献综述表明,图神经网络是当前互联网上应用最广泛的推荐算法之一,该研究剖析了推荐系统和图神经网络的背景和发展,并分类讨论了推荐系统的设置以及图神经网络的谱模型和空间模型,同时探讨了将图神经网络应用于推荐系统的动机,并分析了在图构建、嵌入传播聚合和计算效率方面面临的挑战和未解决问题,从而为未来的研究方向和发展提供了指导。
本研究提出了一种基于弹性嵌入的轻量级推荐算法,它允许在不重新训练的情况下自动适应任意设备特定的内存限制,并通过多样性驱动的规则化和性能估计法来获得更出色的性能表现。
Jun, 2021