学习将多语言表示扩展到视觉语言任务

ECCVApr, 2020

学习将多语言表示扩展到视觉语言任务

Learning to Scale Multilingual Representations for Vision-Language Tasks

Andrea Burns, Donghyun Kim, Derry Wijaya, Kate Saenko, Bryan A. Plummer

TL;DR提出一种 SMALR 模型，它支持多种语言，其许多单词具有固定的语言不可知表示，同时保留少量的特定语言特征，并且它使用掩模交叉语言建模损失来对齐其他语言的上下文特征，具有较好的跨语言一致性。验证了该模型在多语言图像 - 句子检索任务上的有效性。

Abstract

Current multilingual vision-language models either require a large number of additional parameters for each supported language, or suffer performance degradation as languages are added. In this paper, we propose a Scalable Multilingual Aligned Language Representation (SMALR) that suppo

multilingual vision-language models scalable multilingual aligned language representation masked cross-language modeling loss cross-lingual consistency module multilingual image-sentence retrieval

发现论文，激发创造

大规模跨语言无监督表示学习

通过在 100 种语言上使用超过 2TB 的 CommonCrawl 数据对基于 Transformer 的掩蔽语言模型进行大规模的预训练，该模型命名为 XLM-R，显著优于 mBERT，在跨语言基准测试中实现了 + 14.6％和 + 13％的平均准确性和 F1 分数，并改善了 10 个低资源语言的准确性，显示了前景。

Nov, 2019

轻量级跨语言句子表示学习

本文介绍了一种轻量级双变压器体系结构，用于生成记忆高效的跨语言句子表示。同时，还提出了一种新的跨语言语言模型，并引入了两个计算良好的句子级对比学习任务，以提高跨语言句子表示空间的对齐度，从而补偿生成任务的学习瓶颈。实验结果表明，在跨语言句子检索和多语言文档分类方面，与竞争模型相比，我们提出的新的训练任务有效性更高。

May, 2021

利用无监督多语言上下文化表示进行低资源序列标注

本文提出了多语言语言模型与深度语义对准（MLMA），用于产生跨语言标注的语言无关表示，方法不需要平行数据或一个词一个词匹配，只需要单语语料库，并利用深度上下文表示。实验结果表明，本方法在欧洲语言以及英语和汉语等远距离语言对上实现了新的最新 NER 和 POS 性能。

Oct, 2019

跨语言一致性正则化学习多语句子表示

MuSR 是一种支持 220 多种语言的全能多语种句子表示模型，通过使用数十亿个英文为中心的平行语料库，采用使用跨语言一致性规则化技术的多语言 NMT 框架，以训练多语言 Transformer 编码器，并采用辅助 Transformer 解码器，实现了多语言相似性搜索和双文本挖掘任务，表现优于由 148 个独立的多语种句子编码器组成的 LASER3。

Jun, 2023

正则化表示对齐下的跨语言口语理解

本篇论文提出了一种基于正则化和对抗训练的跨语言模型，能够在口语理解系统中实现单词层面和句子层面的跨语言表示对齐，并在少量数据和零样本情况下实现比当前最先进方法更好的性能表现。

Sep, 2020

跨语言的子词映射和定位

提出了一种名为 SMALA 的跨语言子词表构建方法，通过使用无监督的映射技术提取子词对齐并基于子词相似性创建跨语言锚点，可用于改善多语言自然语言推理和神经机器翻译等任务。

Sep, 2021

SAMU-XLSR：语义对齐的多模态话语级跨语言语音表示

提出了 SAMU-XLSR 模型，基于语义对齐的多模态跨语言话语级别语音表示学习框架。通过将 XLS-R 模型和 LaBSE 模型组合，SAMU-XLSR 模型可以提取高质量的多模态多语言话语语音特征，并可以实现跨语音和跨文字之间的相互转换。

May, 2022

PaLI-X: 多语言视觉与语言模型的扩展

PaLI-X 是一种多语言视觉和语言模型，在组件大小和训练任务混合的广度方面进行了扩展，实现了对各种各样复杂任务的新水平的性能提升，涵盖图像字幕、问题回答、图像文档理解、物体检测、视频问题回答和视频字幕等。

May, 2023

借助语言对齐将大型语言模型推广到非英语语境

通过建立语言间的语义对齐，提出通过使用非英语训练数据来增强预训练大型语言模型在非英语语言上的能力，并通过实验结果证明此方法在六种非英语语言上超过英语模型 42.50%，在汉语人文任务上超过英语模型 8.2%。同时发现，使用非英语文本作为翻译数据的目标端特别有效，且随着翻译任务数据规模的扩大，语言模型内部的语义对齐能够进一步加强。

Aug, 2023

SMaLL-100: 为低资源语言引入浅层多语言机器翻译模型

本篇研究介绍了 SMaLL-100 这一经过精简的、涵盖了 100 种语言的多语言机器翻译模型，并证明它在处理低资源语言方面能够超越之前的大规模多语言模型。

Oct, 2022