可解释的多任务学习与共享的变量嵌入

May, 2024

可解释的多任务学习与共享的变量嵌入

Interpretable Multi-task Learning with Shared Variable Embeddings

Maciej Żelaszczyk, Jacek Mańdziuk

TL;DR该论文提出了一种具有共享信息的通用可解释性预测系统，该系统能够在不同的多任务设置中进行预测，其中各个任务不一定具有相同的输入 / 输出结构。通过在一个共同的空间中获取输入和输出变量的嵌入，通过参考一组共享的嵌入来生成输入嵌入，这些嵌入在任务之间被重复使用。所有的嵌入都被视为模型参数并进行学习。论文通过对共享嵌入空间和注意机制的稀疏性进行具体的限制。实验证明，引入共享嵌入并不会损害从基本变量嵌入方法中得到的结果。进一步进行了一系列的剔除分析。在注意机制中引入稀疏性既提高了准确性，又显著减少了所需的训练步骤的数量。共享嵌入在定性评估和将特定共享嵌入映射到预定义概念方面提供了可解释性的度量，而这些概念不是针对所考虑的模型设计的。准确性和可解释性之间存在一种权衡。基本的共享嵌入方法注重可解释性，而稀疏注意方法则提倡准确性。研究结果表明，可将变量嵌入方法扩展为共享信息方法，以提供更高的可解释性和准确性。

Abstract

This paper proposes a general interpretable predictive system with shared information. The system is able to perform predictions in a multi-task setting where distinct tasks are not bound to have the same input/o

interpretable predictive system multi-task setting shared embeddings sparsity of attention mechanism accuracy and interpretability

发现论文，激发创造

旅行观察者模型：通过空间可变嵌入进行多任务学习

该论文提出了一种基于机器学习框架的数据预测方案，能够将看似无关的任务通过将其输入和输出变量嵌入到共享空间中解决，并在实验中显示了远优于单任务和多任务学习替代方案的表现。

Oct, 2020

学习和评估稀疏可解释的句子嵌入

本文通过引入稀疏表示的思想将 word embeddings 应用到 sentence embeddings 中，基于主题连贯性方法引入了一种新的、定量的自动化评估指标，并在电影对话数据集和 MS COCO 数据集的场景描述上观察到了 interpretability 的提高。

Sep, 2018

共享多模态嵌入的无监督图像字幕生成

通过共享的、结构化的视觉概念潜在空间，将图像特征转化到语义向量嵌入空间中，并使用同一语言模型将其解码为场景描述，无需明确监督来了解图像；这种转化借助于暴露于图像 / 标题数据分布之外的大型文本语料库，并且具有鲁棒性。

Aug, 2019

可解释的具有稀疏自表示的神经嵌入

通过将数据自表示与浅层神经网络相关联，提出了一种新颖的方法来学习表达性和可解释性更高的词嵌入，并在下游任务中表现出竞争性和性能更好的结果。

Jun, 2023

SPINE: 稀疏可解释神经嵌入

通过新颖的去噪 k 稀疏自编码器的变种，我们生成了高效且可解释的词向量，并在大规模人类评估中表现出比 GloVe 和 word2vec 更好的可解释性和性能。

Nov, 2017

不同注意力，同样表示：从多任务中共享句子表示学习

本文提出了一种新的多任务学习的信息共享方案，通过注意力机制为所有任务共享相同的句子表示，使每个任务都能从中选择任务特定的信息，并在 16 个不同的文本分类任务上进行了实验，证明了该架构的优势。

Apr, 2018

可解释的嵌入式技术用于即时视频搜索

通过集成特征嵌入和概念解释到神经网络中进行统一的双重任务学习，本论文实现了将嵌入与语义概念关联，作为视频内容解释的新方法，并在 TRECVid 基准数据集上证明了搜索结果的显著提升。

Feb, 2024

多变量数据上可解释的 LSTM 网络探索

本文研究 LSTM 循环神经网络，探索变量的隐藏状态来捕获多变量时间序列的不同动态，并提出了混合注意机制模型来轨迹生成目标，最终建立联合训练模型以增强准确性并在多变量数据的预测与知识提取中展现潜力。

May, 2019

共享表示的分布式多任务学习

研究了在多个机器学习一个未知的低维子空间中具有共享表示的分布式多任务学习问题，通过高效通信的方法来利用共享结构。

Mar, 2016

多任务学习中信息传输的理解与改善

本文研究了多任务学习的方法，使用共享特征表示所有任务，并研究了线性和 ReLU 激活模型的理论。通过实验证明了任务数据的对齐有助于多任务训练和转移学习，特别地，我们的对齐方法比 BERT-LARGE 在 5 个 GLUE 任务上平均提高了 2.35％的得分，并设计了基于 SVD 的任务重新加权方案来提高多任务训练在多标签图像数据集上的鲁棒性。

May, 2020