本论文提出了一种基于概念的弱监督对抗训练方法,通过将单词映射到连续向量的分布表示法,实现不需要大量平行数据(如字典或句子对齐语料库)的语言间互译,并针对语言间距离大的情况,在大多数语言上改善了以前无监督的对抗方法的性能。
Apr, 2019
本文提出了一个 DAASI 方法用于多语言语言对的句子插值, 该方法可通过学习源语言和目标语言的中间潜在表示来优化基于 GAN 的多语言翻译模型。实验证明,在低资源语言对上,该方法的表现超过了现有的最先进方法,性能提高了最多 4 BLEU 分数。
Mar, 2023
该论文挑战了生成对抗网络(GAN)如何对独立的英语单词嵌入进行完美对齐,并探究了不同嵌入算法之间为什么会出现对齐失败的情况。作者认为这对于理解现代单词嵌入算法及 GAN 的局限性和不稳定性动态至关重要,并且该发现可能是与嵌入算法的归纳偏差有关,导致了一个局部最优解的优化领域,使得收敛区域很小。
Sep, 2018
本文介绍了一种基于迭代匹配方法的无监督单词翻译方法,该方法在欧洲和非欧洲语言单词翻译任务中表现优于最新的深度对抗方法,并且具有可解释性。
Jan, 2018
本文提出了一种名为 TESGAN 的框架,使用连续文本嵌入空间而非离散标记以解决梯度反向传播的问题,通过无监督学习来克服数据记忆问题,从而能够合成具有潜力的新句子。
Jun, 2023
提出了 Adversarial Bi-directional Sentence Embedding Mapping(ABSent)框架,它能够从有限量的平行数据中学习跨语言句子表示的映射,解决了跨语言转移学习中平行数据量有限的问题。
Jan, 2020
本文提出了一种基于无监督学习的算法,通过分布匹配和最小化回译损失来优化两种语言单词嵌入空间之间的转换函数,使用神经网络计算 Sinkhorn 距离评估性能并在跨语言词汇相似度预测和双语词汇归纳等任务中具有强大的性能。
通过设计 BiGANs 模型实现 GANs 的逆向学习与无监督特征学习以及其在辅助监督鉴别任务中的有效性。
May, 2016
该论文探讨了一种无监督的方法,用于推导出一种通用的,跨语言的词嵌入空间,其中不同语言中具有类似语义的单词彼此接近。通过使用线性插值的一系列中间空间,该方法模拟了计算机视觉中的域流方法,以提高跨语言自然语言推理的性能。
Oct, 2022
本文提出了一种新的无监督初始化和稳健的自学习算法来学习跨语言词嵌入,成功地克服了传统方法在更实际的语境下所面临的困难,并在标准数据集上取得了最佳效果,甚至超过了以往的监督式系统。
May, 2018