双向解码框架：以形态变化为例的案例研究

May, 2023

双向解码框架：以形态变化为例的案例研究

A Framework for Bidirectional Decoding: Case Study in Morphological Inflection

Marc E. Canby, Julia Hockenmaier

TL;DR本文中，我们提出了一种从外向内生成序列的解码框架，该框架通过动态规划等多种训练方法，支持多种模型结构，并在推土机 2023 转换任务上取得显著提高。

Abstract

Transformer-based encoder-decoder models that generate outputs in a left-to-right fashion have become standard for sequence-to-sequence tasks. In this paper, we propose a framework for decoding that produces sequences from the "outside-in": at each step, the model chooses to generate a

transformer-based models decoding framework left-to-right fashion dynamic programming sota

发现论文，激发创造

快速交替双向序列生成

本文提出了一种交叉双向的解码器，它能同时进行从左到右和从右到左的目标词语生成，并且相较于自回归解码等传统解码方式在保持质量的情况下能实现达到 2 倍的解码速度提升。此外，作者还探索了同时预测多个相邻 token 的方法，以及根据目标序列进行分区解码的多向模型，这些方法也能够在不损失太多准确度的情况下进一步提高解码速度。

Oct, 2020

中间向外解码

提出了一种新的序列生成模型，中心向两侧扩展，使用双重的自我注意机制来控制生成的多样性，并在视频字幕和序列去噪方面取得了显著的改进。

Oct, 2018

序列生成：从两端到中间

提出了一种同步双向序列生成模型，利用双向注意力网络实现从两个方向同时预测输出，解决了自回归解码方式生成长句时效率低，以及和未来内容关联性不足等问题，在神经机器翻译（英德、中英和英罗）以及文本摘要任务上，相比于自回归 Transformer，提高了生成质量且显著提升了解码速度。

Jun, 2019

神经序列生成的同步双向推理

提出了一种同步双向推理模型，基于先前预测的左侧历史假设和右侧未来预测，同时利用从左到右和从右到左的解码生成输出，通过机器翻译和摘要生成等多个任务的广泛实验表明，其表现很好。

Feb, 2019

神经机器翻译的异步双向解码

本文提出了一种基于双向解码器的神经机器翻译模型，其中正向解码器按原有的方法工作，但加入了逆向解码器，以利用源语言和目标语言的双向信息，从而提高翻译质量。实验结果表明，该模型在中英文和英德文翻译任务上均能够显著提高 NMT 的效果。

Jan, 2018

同步双向神经机器翻译

本研究提出了同步双向神经机器翻译模型，通过同时进行从左到右和从右到左解码，以相互交互的方式预测输出，从而利用历史和未来信息，并在大规模数据上实验证明其优于强的 Transformer 模型，达到了中英文和英德文翻译任务的最新性能。

May, 2019

使用显式形态表示的单模型编码器 - 解码器用于重构

提出利用神经编码器 - 解码器模型对形态学再生成的任务进行建模，进一步提出利用基于编辑树的输出自动校正方法，降低对训练数据量的依赖，实现了对低资源语言的形态学再生任务的优化。

Jun, 2016

神经机器翻译中目标语言形态的建模：策略比较

本文研究机器翻译中针对形态丰富的目标语言面临的挑战以及采用词元标记策略和语言学知识进行目标语言语言建模的实验，结果表明词汇量限制、语法一致性和语言关联性问题仍然是机器翻译需要解决的重要问题。

Mar, 2022

Copenhagen at CoNLL--SIGMORPHON 2018: 多语种词形变化的明示形态句法解码与上下文

该研究记录了使用编码器 - 解码器结构、多任务学习和多语言训练等创新方法，在 CoNLL-SIGMORPHON 2018 共享任务中获得高准确度表现的 Team Copenhagen 系统，主要关注于上下文中的词形转化，进而提高词形转化的质量。

Sep, 2018

使用序列解码器进行形态分析

本文介绍 Morse，一种循环编码器解码器模型，用于生成语句中每个单词的形态分析。该模型可生成单独的形态特征，表现出色且能处理少见标签和各种复杂语言。

May, 2018