多重对抗学习用于跨语言单词嵌入

Oct, 2020

多重对抗学习用于跨语言单词嵌入

Multi-Adversarial Learning for Cross-Lingual Word Embeddings

Haozhou Wang, James Henderson, Paola Merlo

TL;DR提出了一种基于多对抗学习的新方法，用于在远程语言之间诱导跨语言词嵌入，改善了以往单映射方法的性能，特别是对于远程语言的情况

Abstract

generative adversarial networks (GANs) have succeeded in inducing cross-lingual word embeddings -- maps of matching words across languages -- without supervision. Despite these successes, GANs' performance for th

generative adversarial networks cross-lingual word embeddings multi-adversarial learning method unsupervised bilingual lexicon induction distant languages

发现论文，激发创造

基于概念的弱监督对抗学习用于跨语言词嵌入

本论文提出了一种基于概念的弱监督对抗训练方法，通过将单词映射到连续向量的分布表示法，实现不需要大量平行数据（如字典或句子对齐语料库）的语言间互译，并针对语言间距离大的情况，在大多数语言上改善了以前无监督的对抗方法的性能。

Apr, 2019

通过敌对训练利用多语言能力在低资源神经机器翻译中的应用

本文提出了一个 DAASI 方法用于多语言语言对的句子插值，该方法可通过学习源语言和目标语言的中间潜在表示来优化基于 GAN 的多语言翻译模型。实验证明，在低资源语言对上，该方法的表现超过了现有的最先进方法，性能提高了最多 4 BLEU 分数。

Mar, 2023

为何不同算法的英文嵌入无监督对齐如此困难？

该论文挑战了生成对抗网络（GAN）如何对独立的英语单词嵌入进行完美对齐，并探究了不同嵌入算法之间为什么会出现对齐失败的情况。作者认为这对于理解现代单词嵌入算法及 GAN 的局限性和不稳定性动态至关重要，并且该发现可能是与嵌入算法的归纳偏差有关，导致了一个局部最优解的优化领域，使得收敛区域很小。

Sep, 2018

非对抗式无监督单词翻译

本文介绍了一种基于迭代匹配方法的无监督单词翻译方法，该方法在欧洲和非欧洲语言单词翻译任务中表现优于最新的深度对抗方法，并且具有可解释性。

Jan, 2018

使用生成对抗网络生成无监督文本嵌入空间以进行文本合成

本文提出了一种名为 TESGAN 的框架，使用连续文本嵌入空间而非离散标记以解决梯度反向传播的问题，通过无监督学习来克服数据记忆问题，从而能够合成具有潜力的新句子。

Jun, 2023

ABsent: 双向 GAN 的跨语言句子表示映射

提出了 Adversarial Bi-directional Sentence Embedding Mapping（ABSent）框架，它能够从有限量的平行数据中学习跨语言句子表示的映射，解决了跨语言转移学习中平行数据量有限的问题。

Jan, 2020

无监督的跨语言词向量空间转移

本文提出了一种基于无监督学习的算法，通过分布匹配和最小化回译损失来优化两种语言单词嵌入空间之间的转换函数，使用神经网络计算 Sinkhorn 距离评估性能并在跨语言词汇相似度预测和双语词汇归纳等任务中具有强大的性能。

Sep, 2018

对抗特征学习

通过设计 BiGANs 模型实现 GANs 的逆向学习与无监督特征学习以及其在辅助监督鉴别任务中的有效性。

May, 2016

领域流插值的鲁棒无监督跨语言词嵌入

该论文探讨了一种无监督的方法，用于推导出一种通用的，跨语言的词嵌入空间，其中不同语言中具有类似语义的单词彼此接近。通过使用线性插值的一系列中间空间，该方法模拟了计算机视觉中的域流方法，以提高跨语言自然语言推理的性能。

Oct, 2022

一种强大的自学习方法：全无监督跨语言词嵌入映射

本文提出了一种新的无监督初始化和稳健的自学习算法来学习跨语言词嵌入，成功地克服了传统方法在更实际的语境下所面临的困难，并在标准数据集上取得了最佳效果，甚至超过了以往的监督式系统。

May, 2018