随机线性代数快速标签嵌入

KDDDec, 2014

Fast Label Embeddings via Randomized Linear Algebra

Paul Mineiro, Nikos Karampatziakis

TL;DR本文介绍了一种利用等级约束估计和低维度标签嵌入之间的对应关系发现的快速标签嵌入算法，该算法适用于多类和多标签数据集，并且其运行时间比朴素算法快效果显著，该方法在两个大规模公共数据集上进行了验证，并获得了最先进的结果。

Abstract

Many modern multiclass and multilabel problems are characterized by increasingly large output spaces. For these problems, label embeddings

label embeddings multiclass multilabel estimation randomized algorithm

发现论文，激发创造

极大输出空间的快速标签嵌入

本文提出了利用排名约束估计与低维标签嵌入之间的对应关系来发现一种新的、快速的标签嵌入算法，并展示了其在多类问题和多标签问题中的应用，最终实现了指数级的运行时间优化，其中在两个大规模公共数据集上的结果优于现有技术。

Mar, 2015

大规模图像分类的信息理论标签嵌入

本文介绍了一种用于训练多标签、大规模多类别图像分类模型的方法，通过将高维稀疏标签嵌入到具有单位范数的低维密集球体上，并将分类问题视为该球体上余弦相似度回归问题，其比基于逻辑回归的 sigmoid 交叉熵损失函数的监督方法更快更准确，经过在 300 million 高分辨率图像和 17,000 标签的数据集上测试，相对于逻辑回归，该方法收敛速度明显提高，平均精度也提高了 7%。

Jul, 2016

通过 Johnson-Lindenstrauss 矩阵进行标签嵌入

本文介绍一种基于 Johnson-Lindenstrauss 矩阵的极端多类分类的简单可拓展的框架，该框架使用 JLM 的列来嵌入标签，将分类问题转换为具有对数 C 输出维度的回归问题，并通过冗余分析，揭示了计算效率和预测精度之间的折衷关系。我们的方法易于并行化，并且实验结果表明，在大规模应用中具有有效性和可扩展性。

May, 2023

度量学习的深度随机集合

本文提出了一种新颖、可推广和快速的方法，定义了一组嵌入函数集合，并通过随机挑选小的标签子集来学习每个嵌入函数。实验证明，这些嵌入集合可创建有效的嵌入函数，这些函数用于图像检索，并在 CUB-200-2011、Cars-196、In-Shop Clothes 检索以及 VehicleID 上提高了最先进的性能。

Aug, 2018

极端多标签学习的本地非线性嵌入

本文介绍了 X-One 分类器，其使用小型本地距离保存嵌入，可以准确预测罕见（尾部）标签的聚合，提高了分类准确性，可有效且较之于嵌入法和树法的现有极端多标签分类算法，对于拥有百万标签的数据集也能高效扩展。

Jul, 2015

基于结构预测的标签排序方法

本文提出了一种基于最小二乘代理损失的方法来解决标签排名问题，并针对本方法采用了具体的特征映射 / 嵌入来转换排名 / 排列为向量表示，旨在提高结构化预测的效率和准确性，在部分排名情况下有着良好的表现。

Jul, 2018

基于低秩矩阵分解的文本分类在线嵌入压缩

本研究提出一种深度学习模型的压缩方法，利用低秩矩阵因式分解来压缩自然语言处理中的字词嵌入层，经过实验证明可以在 90% 的压缩比下保持精度不受影响，并且在句子分类任务上表现优于其他方法，同时还引入了一种新的学习率调度算法 CALR，其在句子分类基准测试中表现出优越性。

Nov, 2018

高效多示例多标签学习

本文提出了一种名为 MIMLfast 的方法来解决大规模数据集上的多实例多标记学习问题，该方法通过构建在所有标签之间共享的低维子空间并训练标签特定的线性模型来优化近似排名损失，并探索复杂标签的子概念以实现良好性能，该方法时间成本大大降低。

Oct, 2013

基于复数嵌入的简单链接预测

该研究基于复嵌入提出了一种解决大型知识库中链接预测问题的方法，相对于其他模型而言，这种方法更简单且可扩展性好，同时在标准链接预测测试中保持了更高的性能。

Jun, 2016

高维贝叶斯优化中线性嵌入的重新审视

本文通过对现有线性嵌入的文献进行研究后，识别出其中的一些关键问题和误解，并在解决这些问题的基础上，极大地提高了利用线性嵌入进行 Bayesian 优化的效能，包括机器人运动中学习步态策略等方面。

Jan, 2020