语义解析的领域自适应

Jun, 2020

Domain Adaptation for Semantic Parsing

Zechang Li, Yuxuan Lai, Yansong Feng, Dongyan Zhao

TL;DR本文提出了一种利用两阶段粗到细的框架进行领域自适应的新型语义解析器，能够在目标域与源域数据相比相对少的情况下实现自适应，并显著改进了现有领域自适应策略。

Abstract

Recently, semantic parsing has attracted much attention in the community. Although many neural modeling efforts have greatly improved the performance, it still suffers from the data scarcity issue. In this paper,

发现论文，激发创造

跨领域语义解析通过释义

本文提出了一种序列到序列的注意力重点改进的方法，用于跨域语义分析的域间适应问题，并且对预先训练的词嵌入进行了标准化，这种方法在 Overnight 数据集上有显着的改进。

Apr, 2017

使用几十个部分注释的示例扩展解析器至远领域

通过使用神经网络的词表示方法，在与源领域语法相似的情况下，重新审视了领域适应。并提供了一种简单的方法，通过使用少量的部分注释来适应解析器。文章提供的新算法的结果，使华尔街日报测试集的最新单模型状态达到94.3％，比之前最先进的92.6％有一个绝对提高了1.7％。

May, 2018

神经机器翻译的领域差异适应

本文介绍了『Domain Differential Adaptation（DDA）』的框架，该框架通过使用相关任务中的模型直接建模不同领域之间的差异，从而成功地应用于神经机器翻译的领域自适应中，并在多个实验设置中实现比其他替代方法更好的改进效果。

Oct, 2019

自然语言处理中的神经非监督领域自适应 -- 一项调查

本篇综述针对最近的研究进展，对不需要标记目标领域数据的神经无监督领域自适应技术进行了概述，包括从传统非神经方法到预训练模型迁移的方法，并揭示了自然语言处理任务类型中存在的偏见问题以及未来的研究方向，特别是面向 NLP 的超分布通用化需求。

May, 2020

面向组合式任务的低资源域自适应语义解析

本文介绍了一种新方法，使用BART进行表征学习并使用基于优化的元学习方法来提高到低资源域的泛化性能，以使任务导向的语义解析器适应低资源域，这种方法在新收集的多领域任务导向语义解析数据集（TOPv2）方面明显优于所有基线方法。

Oct, 2020

语义解析中的领域泛化元学习

本文尝试使用基于元学习的框架，旨在实现语义解析的零-shot泛化能力，实验结果表明，这种方法对Spider数据集上的解析表现有显著的提升。

Oct, 2020

利用随机单元增强预训练模型进行神经监督域自适应

本文提出一种针对使用标准微调的神经迁移学习在特定于目标域的模式学习方面存在限制的问题的解决方案，即向预训练模型中引入归一化、加权和随机初始化的单元，以更好地适应目标域。实验证明，该方法在自然语言处理中的四项任务中表现出显著的改进。

Jun, 2021

自适应分词的语言模型高效域适应

通过适应标记器，将预训练语言模型转移到新领域，提供了与基于专门领域的预训练方法相当的性能，同时生成的模型更小且训练和推断时间更短。

Sep, 2021

M2D2：一种大规模多领域语言建模数据集

M2D2是一个细粒度的、大规模的多域语料库，用于研究语言模型中的域适应。该语料库包含来自维基百科和语义学者的145个域，共计 8.5B 个标记。使用来自维基百科和ArXiv分类的本体结构，我们将每个数据源中的域组织到22个组中。

Oct, 2022

关于预训练语言模型的领域自适应和泛化：一项综述

本文介绍了近年来自然语言处理中预训练语言模型（PLMs）的最新进展，并为适应目标领域提供了一种有效的方法。考察了PLMs的应用问题并提出了域自适应方法的分类方案，包括输入扩充、模型优化和个性化等方法。

Nov, 2022