GILE: 通用输入标签嵌入用于文本分类

ACLJun, 2018

GILE: 通用输入标签嵌入用于文本分类

GILE: A Generalized Input-Label Embedding for Text Classification

Nikolaos Pappas, James Henderson

TL;DR本文提出了一种新的输入 - 标签模型，该模型利用标签语义和非线性输入标签嵌入来实现更好的文本分类性能，并通过跨语言和零资源的多语种文本分类实验证明了该模型的优越性。

Abstract

neural text classification models typically treat output labels as categorical variables which lack description and semantics. This forces their parametrization to be dependent on the label set size, and, hence, they are unable to scale to large label sets and generalize to unseen ones

neural text classification label semantics non-linear input-label embedding cross-entropy loss multilingual text classification

发现论文，激发创造

文字分类的词与标签联合嵌入

采用标签 - 词汇联合嵌入法和注意力机制的词嵌入模型，用于文本分类并保持了词嵌入的可解释性，同时提供了利用其他信息的能力。在多个大型文本数据集上实验表明，该方法在准确率和速度方面均优于现有最先进方法。

May, 2018

大规模图像分类的信息理论标签嵌入

本文介绍了一种用于训练多标签、大规模多类别图像分类模型的方法，通过将高维稀疏标签嵌入到具有单位范数的低维密集球体上，并将分类问题视为该球体上余弦相似度回归问题，其比基于逻辑回归的 sigmoid 交叉熵损失函数的监督方法更快更准确，经过在 300 million 高分辨率图像和 17,000 标签的数据集上测试，相对于逻辑回归，该方法收敛速度明显提高，平均精度也提高了 7%。

Jul, 2016

朝向具有多阶段对比学习的通用文本嵌入

我们提出了 GTE，一个用多阶段对比学习训练的通用文本嵌入模型，通过在多个数据源的各种混合数据集上进行对比学习，训练一个统一的文本嵌入模型。通过显著增加训练数据量，在无监督预训练和有监督微调阶段，取得了比现有嵌入模型更大的性能提升。此外，我们的模型在处理代码时无需额外细调每种编程语言，仅将代码视为文本就能超过类似大小的以前最佳代码检索器的性能。总之，我们的模型通过有效利用多阶段对比学习实现了令人印象深刻的结果，提供了一种强大而高效的文本嵌入模型，在各种 NLP 和代码相关任务中具有广泛的适用性。

Aug, 2023

极大输出空间的快速标签嵌入

本文提出了利用排名约束估计与低维标签嵌入之间的对应关系来发现一种新的、快速的标签嵌入算法，并展示了其在多类问题和多标签问题中的应用，最终实现了指数级的运行时间优化，其中在两个大规模公共数据集上的结果优于现有技术。

Mar, 2015

层次化多标签分类的双曲线标签嵌入联合学习

本文提出了一种联合学习分类器参数与标签嵌入的方法，用于多标签分类的层次化关系建模，结果表明该方法对具有效性，超过了以往基于共现信息的预训练超几何嵌入方法。

Jan, 2021

增强式自然语言用于生成式序列标记

该研究提出了一种生成式框架，用于多个序列标记任务和句子级分类。与以往的判别式方法不同，该模型通过共享自然语言输出空间，自然地融合标签语义，并在任务之间共享知识。该框架具有通用性，可在 few-shot、低资源和高资源任务上表现良好，并在命名实体识别、槽位标记和意图分类等基准测试中展示了这些优势。

Sep, 2020

使用 GloVe 和神经网络模型进行多标签文本分类

多标签文本分类面临诸多挑战，本文提出了一种基于 GloVe 模型和 CNN-BiLSTM 网络的词袋模型方法，该方法在测试集上达到了 87.26% 的准确率和 0.8737 的 F1 分数，展现出了良好的结果。

Oct, 2023

随机线性代数快速标签嵌入

本文介绍了一种利用等级约束估计和低维度标签嵌入之间的对应关系发现的快速标签嵌入算法，该算法适用于多类和多标签数据集，并且其运行时间比朴素算法快效果显著，该方法在两个大规模公共数据集上进行了验证，并获得了最先进的结果。

Dec, 2014

文本分类的多任务标签嵌入

本文提出了 Multi-Task Label Embedding 模型，将文本分类中的标签转换为语义向量，从而将原始任务转化为向量匹配任务，利用任务间的语义相关性进行多任务学习，有效提升相关任务的性能。

Oct, 2017

利用质量加权的弱监督自动标注共同提高语言理解和生成能力

本研究提出了一种半监督框架，利用 GPT-2 模型自动构建了大规模数据，并根据估计的标签质量调整模型参数更新，实现 NLG 和 NLU 模型的联合训练，证明在数据稀缺场景下，该弱监督培训范式是一种有效的方法，在 E2E 和天气基准测试上优于基准系统。

Feb, 2021