关于 NADO 的组合性与改进训练

Jun, 2023

On Compositionality and Improved Training of NADO

Sidi Lu, Wenbo Zhao, Chenyang Tao, Arpit Gupta, Shanchan Wu...

TL;DR本文提出了 NeurAlly-Decomposed Oracle（NADO）方法，以避免大型基础模型的灾难性忘却，同时保证收敛到一个熵最大化的 closed-form solution，提高了训练效果。同时，针对多个控制信号的组合和低概率控制信号下的梯度消失等问题提出了改进措施。

Abstract

neurally-decomposed oracle (NADO) is a powerful approach for controllable generation with large language models. Differentiating from finetuning/prompt tuning, it has the potential to avoid catastrophic forgettin

neurally-decomposed oracle controllable generation large language models composition of multiple control signals forward-consistency regularization

发现论文，激发创造

使用神经分解 Oracle 实现可控文本生成

本研究提出基于 NeurAlly-Decomposed Oracle (NADO) 的通用高效生成模型控制框架，其中 NADO 将控制模型分解为词级指导以引导底层模型在文本生成过程中生成符合预期的结果，通过实验证明，本框架在维护高生成质量的同时能高效地指导模型生成出符合特定条件要求的结果。

May, 2022

NADS: 基于神经体系结构分布搜索的不确定性感知

提出了神经结构分布搜索 (Neural Architecture Distribution Search，NADS) 的指导原则来设计确定性感知架构，优化了随机的 Out-of-Distribution 检测目标，并构建了模型集合来执行 OoD 检测，在 15 个不同的测试配置中相对于最先进的方法准确率的提高高达 57％。

Jun, 2020

关于深度 NADE 与生成随机网络之间的等价性

本研究提出了一种新的采样过程（退火 GSN 采样），用于从已训练的 Orderless NADE 模型中采样，以便在节省时间的同时保持样品质量，同时该过程建立了 NADE 模型的马尔可夫链并证明了该模型与 GSNS 的训练标准之间的联系

Sep, 2014

面向嘈杂标注下的鲁棒自适应目标检测

本研究提出一种面向带有噪声注释的领域自适应目标检测（DAOD）的框架，包括潜在实例挖掘、可变形图关系模块和熵感知梯度协调等关键技术，将语义信息纳入学习过程，取得了不错的实验成果。

Apr, 2022

将神经链接预测器应用于复杂查询回答

本文提出了 CQD$^{A}$，即通过训练参数高效的分数调整模型来重新校准神经链接预测分数，从而解决了 CQD 方法中的问题，大大提高了结果的准确性，同时具有数据效率和鲁棒性。

Jan, 2023

基于同伦的神经常微分方程训练，用于准确的动态探索

本研究提出一种利用混沌和数学优化的训练算法，可有效解决 NeuralODEs 实际应用中训练时间长，效果不佳的问题。与传统训练方法相比，该算法在不更改模型架构的情况下，可大幅降低误差值，并能够准确地捕捉真实的长期行为并正确地向未来外推。

Oct, 2022

网络中的增强学习分散式在线凸优化

本文讨论了基于网络化多智能体系统的分散在线凸优化，并提出了一种新的算法 —— 学习增强的分散式在线优化（LADO），使个体代理人仅基于本地在线信息选择动作。与现有的集中式学习增强在线算法形成鲜明对比，LADO 实现了分散式设置下的强大的鲁棒性保证。我们还证明了 LADO 的平均成本限制，揭示了平均性能和最坏情况下鲁棒性之间的权衡，并表明通过明确考虑鲁棒性要求来训练 ML 策略的优势。

Jun, 2023

CoDA: 自然语言理解的对比增强和多样性促进数据增强

本文提出了一种名为 CoDA 的新型数据增强框架，通过整合多种转换方法，试图解决文本数据增强中的标签保留问题。实验表明，CoDA 架构在多种自然语言理解任务中平均提高了 2.2% 的效果，相较其他基线方法表现更强

Oct, 2020

AdaGAN：提升生成式模型

该研究使用增量算法 AdaGAN 训练 Generative Adversarial Networks（GAN）来解决 GAN 模型中出现的 missing modes 问题，并且证明了当每一步是最优的时候，这种增量方法可以在有限步数内收敛到真实分布，否则以指数速度收敛。

Jan, 2017

神经符号推理及构成不确定性量化用于图形自回归解析的鲁棒性

本文研究了面向神经符号推理的组合感知方法，涉及图预测的不确定性和推广性能，实现了在子图级别的细粒度神经符号推理，具有捕捉图形预测不同方面的神经和符号方法的独特优势，从而在领域间和尾部拥有良好的推广表现。

Jan, 2023