多任务问题下的语言建模

ACLJan, 2021

Language Modelling as a Multi-Task Problem

Lucas Weber, Jaap Jumelet, Elia Bruni, Dieuwke Hupkes

TL;DR本文研究语言模型作为多任务问题，结合了多任务学习，语言学和可解释性三个研究领域。通过研究来自语言学理论的假设，我们调查语言模型在训练过程中是否遵循多任务学习的学习原则。为了展示这个想法，我们分析了语言模型在学习消极极性项（NPIs）的语言概念时的泛化行为。我们的实验表明：在更一般的语言建模任务的目标中，多任务设置自然地出现。我们认为这种洞察力对于多任务学习，语言学和可解释性研究都是有价值的，并且可能导致所有三个领域的令人兴奋的新发现。

Abstract

In this paper, we propose to study language modelling as a multi-task problem, bringing together three strands of research: multi-task learning,

multi-task learning linguistics interpretability negative polarity items language modelling

发现论文，激发创造

多任务和多语言模型用于词法分析

该论文旨在研究和探索使用任务和语言之间的相关性来构建需要较少手动注释数据的自然语言处理模型，通过研究 60 种语言的多种 NLP 任务，该论文表明了联合多任务和多语言建模的潜力，并暗示从这些模型中可以获得语言学洞见。

Sep, 2018

一种支配所有事情的模型：用于词汇分析的多任务和多语言建模

本论文探讨了在自然语言处理方面学习多任务和多语言的交叉点，研究的主要目标是提高文本处理可靠性，尤其是在资源稀缺的语言中，通过利用语言重叠等方法，使得低资源语言能受益于高资源语言的进步。

Nov, 2017

确立可信度：重新思考任务和模型评估

语言理解是一个多方面的认知能力，自然语言处理（NLP）领域几十年来一直致力于计算化建模。最近大型语言模型（LLMs）的出现，使得以生成模型为动力的通用性、任务无关的方法成为主流，这导致了语言任务传统上的划分不再适用，带来了对评估和分析的挑战，同时也加大了对可靠系统的需求。因此，我们主张重新思考 NLP 中任务和模型评估的涵义，并追求对语言的更全面视角，将可靠性放在核心地位。为了实现这一目标，我们回顾了现有的划分式方法，以了解模型功能能力的起源，并提出了多方面评估协议的建议。

Oct, 2023

有效多任务和多语言建模的元学习

通过元学习方法，将任务和语言相互作用的表征共享，可提高自然语言处理任务和多语种任务性能。

Jan, 2021

语言模型使用单调性来评估 NPI 许可

本文探讨语言模型的语义知识，特别关注其是否基于语义单调性属性创建了语言环境类别，并且是否这些类别在语言模型中扮演类似于人类语言理解的作用，以否定极性项许可为案例研究。通过一系列试验，包括探针式诊断分类器、语言可接受性任务，以及一种新型的分类器排名方法，我们能够更深入地了解到这些模型所获得的语义概括。

May, 2021

利用多任务语言建模统一分子和文本表示

提出了一种多领域、多任务的语言模型，能够处理化学和自然语言，并共享模型参数来优化实验室操作和科学发现加速。

Jan, 2023

利用语言资源进行神经机器翻译的多任务学习

本研究表明，多任务学习是将语言学标注引入端到端神经 attention 模型的一个成功和简单的方法，可以对翻译质量产生改善，并且也可以提高词性标注器的性能。

Aug, 2017

语言模型教给你的句法知识比翻译多：通过辅助任务分析所学到的教训

该研究比较了四种不同的预训练目标（语言模型、翻译、跳跃思考和自编码）对模型学习语言信息和句法信息的影响，结果表明语言模型对于转移学习和需要句法信息的应用最为适合。

Sep, 2018

通过任务空间解释语言模型

通过构建语言任务空间，借助相似性探测与梯度差分的微调方法，研究发现大型语言模型更好地泛化到语言任务的总体概念，利用其共享结构。此外，预训练通过加强相关语言任务之间的参数共享来增加语言处理的分布性。整体泛化模式在训练过程中基本稳定且没有明显分界点，这可能解释了语言模型缺乏成功的课程策略的原因。

Jun, 2024

跨语言和内部转换风格的多任务神经模型翻译

本文探讨多任务学习在自然语言生成中的应用，通过多任务学习实现单语言风格转换和基于风格的机器翻译，并展示了在不依赖特定样本的风格注释训练条件下，我们的模型在风格转换和基于风格翻译方面均取得了最先进的性能。

Jun, 2018