使用动态准则改进自回归训练

Jun, 2024

Improving Autoregressive Training with Dynamic Oracles

Jianing Yang, Harshine Visvanathan, Yilin Wang, Xinyi Hu, Matthew Gormley

TL;DR为解决 NLP 任务中的暴露偏差和指标不匹配问题，本文提出了一种基于动态预示算法的解决方案，并开发了新型的动态预示算法，证明其在类似基于跨度的 F1 指标上保持了 DAgger 的无遗憾保证。作者评估了该算法在命名实体识别、文本摘要和机器翻译等任务中的性能，在机器翻译实验中，DAgger with dynamic oracle 的结果不如基准技术，但在命名实体识别和文本摘要方面表现优秀。

Abstract

Many tasks within nlp can be framed as sequential decision problems, ranging from sequence tagging to text generation. However, for many tasks, the standard training methods, including maximum likelihood (teacher

nlp sequential decision problems exposure bias dynamic oracles machine translation

发现论文，激发创造

辩论作为优化：适应性合规预测和多样化检索用于事件抽取

我们提出了一个多智能体辩论作为优化的事件提取系统，通过辩论而无需参数调整来迭代改进大型语言模型的输出。在该系统中，我们引入了两个新模块：Diverse-RAG 模块和 Adaptive Conformal Prediction 模块。实验结果表明，相对于有监督方法和无需调参的基于大型语言模型的方法，在 ACE05 和 CASIE 事件检测以及论证提取方面，性能差距分别降低了 18.1％和 17.8％以及 17.9％和 15.2％。

Jun, 2024

DADAgger：基于分歧扩增的数据集聚合

本文介绍了一种改进的 DAgger 算法 ——DADAgger，它只针对其原数据集中的分布不一致的状态 - 行动对询问专家，并通过 dropout 模拟来测量每个状态的模型预测的行动方差，进而实现高效、良好平衡的训练数据集的构建。

Jan, 2023

基于跨度的成分句法分析：结构标签系统和可证明最优动态预测

通过使用仅包含句子跨度的最小 LSTM 特征表示的新的 shift-reduce 系统以及第一个可以证明最优的动态 Oracle，该算法的时间复杂度是摊销 O（1），相比于标准依赖解析的 O（n ^ 3）Oracle，我们在使用这个 Oracle 进行训练后，在不使用重新排名或外部数据的情况下取得了最好的 F1 分数，而句法解析准确度得到了显著提高。

Dec, 2016

DAGER：大型语言模型的精确梯度反转

DAGER 是一种用于恢复文本数据批的算法，通过利用 self-attention 层的梯度的低秩结构和标记嵌入的离散性质，以精确的方式恢复整个批次的输入文本数据，用于编码器和解码器架构，并在实验中表现出超过 0.99 的 ROUGE-1/2，速度比之前的攻击快了 20 倍，并且在可扩展性上可以处理 10 倍以上的批大小。

May, 2024

扩散遇到 DAgger：增强视觉手眼协调模仿学习

为了解决在执行过程中模拟训练策略中的错误累积问题，本研究提出了一种不需要昂贵代价的 Diffusion Meets DAgger（DMD）方法，利用扩散模型生成能够覆盖分布外状态的样本，从而实现从少量示范中获得稳健性能，实验证明 DMD 比基于 NeRF 的增强方案提高了 50% 的性能。

Feb, 2024

政策梯度作为组块分析中动态 Oracle 的代理

本研究探讨使用策略梯度方法作为独立于特定解析器转移系统的替代动态预言机的多元组监督方法，以直接优化 F1 指标并在训练期间进行探索，从而减少暴露偏差。在三种不同语言的四个成分解析器中，该方法在几乎所有情况下都比静态预言机似然训练方法表现出更高的效果。

Jun, 2018

预训练语言模型的非自回归式文本生成

本文提出了一种基于 BERT 的非自回归文本生成模型，通过引入新的解码策略（ratio-first）以及机制来解决 NAG 模型中的两个问题，并在三个文本生成任务上进行全面评估，证明该模型在速度和性能上均优于现有的非自回归基线模型，在许多强自回归模型上也取得了有竞争力的性能.

Feb, 2021

DRAGIN：基于大型语言模型实时信息需求的动态检索增强生成

Dynamic Retrieval Augmented Generation framework (DRAGIN) improves the strategies for deciding when and what to retrieve during text generation by considering the real-time information needs of Large Language Models (LLMs).

Mar, 2024

DyRRen: 动态检索 - 重排 - 生成器模型在表格和文本数据上用于数值推理

本文提出了一种名为 DyRRen 的扩展检索 - 筛选 - 生成（retriever-reranker-generator）框架，其中每个生成步骤都通过动态的筛选和重新排序所检索到的句子来增强，可以应用于数值推理和融合表格与长文本的 AI 任务中，并在 FinQA 数据集上胜过现有的基线方法。

Nov, 2022

神经符号推理及构成不确定性量化用于图形自回归解析的鲁棒性

本文研究了面向神经符号推理的组合感知方法，涉及图预测的不确定性和推广性能，实现了在子图级别的细粒度神经符号推理，具有捕捉图形预测不同方面的神经和符号方法的独特优势，从而在领域间和尾部拥有良好的推广表现。

Jan, 2023