- AAAIPSG: 基于提示的序列生成用于缩略语提取
本文提出了一种基于提示的序列生成方法,用于缩写词提取任务,可以有效地使用预训练语言模型,提高在低资源设置下越南语和波斯语缩写词提取的性能。
- MM双向图像与文本生成统一多模态转换器
本文研究了图片到文本和文本到图片生成的联合学习,使用了基于 Transformer 的单个多模式模型来统一学习双向任务,并通过两级粒度特征表示和序列级训练进一步改进 Transformer 的统一框架,实验证明,该方法显著提高了先前基于 T - 语音转文本非自回归建模的比较研究
本文对不同的无自回归(NAR)建模方法进行了比较性研究,实验证明了 NAR 模型相较自回归基线的精度降低代价下,可以同时在序列中生成多个输出,具有在实时应用中优足的潜力,在自动语音识别领域的性能差距上得到了一些有趣的发现,并展示了结合这些技 - ICML超越原地损坏:插入和删除在去噪概率模型中
本文提出了一种更广泛的 DDPMs,能够处理序列数据中插入和删除元素的噪声,该模型在算术序列任务和 text8 数据集上表现出较好的结果,并可用于拼写错误的修复。
- EMNLP半结构化文档图像的高性价比端到端信息提取
本文提出了通过将文档信息抽取 (IE) 作为序列生成任务的方式,将现有的基于流水线的 IE 系统转变为端到端系统的尝试,着重解决了大规模实际部署所涉及的实际挑战,并证明了单个端到端 IE 系统仍然能够实现竞争性能。
- ACL基于编辑和重定位的编辑器 —— 用于具有软词汇约束的神经机器翻译
本文介绍了一种基于编辑的转换器,其通过编辑假设使序列生成更加灵活。 实验证明,它在处理序列时,比 Levenshtein Transformer 更有效,并且在标准的机器翻译任务中可以实现与 Levenshtein Transformer - EMNLP搭载离散潜在计划的叙事文本生成
本文提出了一种基于深度潜变量模型的故事生成方法,其首先采样一个锚定词序列为生成过程的一部分,并在训练过程中以该锚定词序列为潜变量来引导无监督生成。通过实验和人工评估,表明该模型的生成故事不仅在故事规划的目标(锚定词序列)上更具准确性,而且在 - EMNLP带条件掩蔽的机器翻译推理策略
本文通过对条件掩蔽语言模型的训练以及推理策略的研究,提出了一种在机器翻译任务中有效的阈值策略,并分析了其在不同任务上的表现。
- ICML一种基于 EM 方法的非自回归条件序列生成方法
本文提出的一种新方法使用统一的 EM 框架共同优化 AR 和 NAR 模型,以有效地引导系统消除输出序列中的多模态,评估结果表明,该方法在机器翻译任务上实现了具有竞争力的性能,同时显著减少了推理延迟。
- ProGen: 蛋白质生成的语言建模
利用 1.2B 的参数语言模型 ProGen,将蛋白质工程视为无监督的序列生成问题,以此利用缺乏昂贵结构注释的蛋白质的日益增长的集合,从而生成出更具有进化多样性的序列,为解决合成生物学、医学和材料科学等领域的根本问题提供了可能。
- EMNLP插入删除变换器
提出了插入删除变压器 —— 一种用于序列生成的新型基于变压器的神经结构和训练方法。其中模型由插入阶段和删除阶段两个执行迭代的阶段组成,通过插入模型输出直接获取删除模型的信号。在合成翻译任务上,相较于仅插入模型,插入删除变压器在 BLEU 分 - ACL利用预训练检查点进行序列生成任务
本篇论文展示了预训练模型的高效性,使用 Transformer-based 序列到序列模型,并将其与公开的预训练检查点匹配,取得了机器翻译、文本摘要、句子拆分和句子融合等方面的最新的最新成果。
- 并行计划采样
本文介绍了一种简单的方法,通过时间并行化可以减轻固定顺序随机替换预测值的 “计划采样”,并在图像生成、文本摘要、对话生成和翻译等任务中实现与传统教师强制训练相当或更好的性能。
- 序列生成的通用框架及其在无向序列模型中的应用
提出使用序列生成的方法来解决从无向神经序列模型(如 BERT)中生成序列的问题,并将其与定向的序列模型进行统一,从而能够使用原来专门为定向序列模型开发的解码算法在无向序列模型中进行机器翻译。在 WMT'14 英德翻译任务上,提出的方法取得了 - 插入变压器:通过插入操作实现灵活序列生成
本研究提出插入变换器,是基于插入操作的迭代,部分自回归模型,可在解码期间在序列中的任何位置插入标记,这种灵活性提供了多种性能优势,特别是在 WMT 2014 英德机器翻译任务中表现出色,成功恢复原始 Transformer 的性能,同时只需 - ACL基于插入的解码方法与自动推断的生成顺序
该论文提出了一种名为 InDIGO 的新型解码算法,该算法通过插入操作支持任意顺序的序列生成,并使用 Transformer 实现。实验结果显示,InDIGO 能够生成遵循任意顺序的序列,同时与传统的从左到右生成方法相比表现出竞争力甚至更好 - 序列生成的近端策略优化及其动态版本
本论文提出了使用动态的 PPO 算法来替换 policy gradient 来更有效地完成序列生成任务(包括虚假聊天机器人),并展示了 PPO 和 PPO-dynamic 相对于 policy gradient 算法在稳定性和性能上的优越性 - AAAI通过目标双向一致性正则化神经机器翻译
提出了一种基于 Kullback-Leibler 散度规则的神经机器翻译(NMT)正则化方法,并采用联合训练策略,将左到右和右到左 NMT 解码器改进互动方式,从而有效提高了中英文和英德翻译任务的表现。
- COLINGSGM: 多标记分类的序列生成模型
本文提出将多标签分类任务视为序列生成问题,并应用具有新型解码器结构的序列生成模型来解决这个任务,实验结果表明我们的建议方法大大优于以前的工作,同时分析实验结果表明建议方法不仅捕捉标签之间的相关性,而且在预测不同标签时自动选择最有信息的词。
- 神经属性机用于程序生成
本文提出了神经属性机(NAM),并研究了其在生成结构复杂的序列方面的效果。NAM 利用逻辑机器表示潜在的语法,并通过优化定制损失函数来教导神经机器语法的约束条件,相比仅从语法样本中训练的传统 RNN,在生成时违规约束条件的情况更少。