- AMLNet:非自回归多时标时间序列预测的对抗求知神经网络
AMLNet 是一种创新的非自回归模型,通过在线知识蒸馏方法实现真实的预测,结合了自回归和非自回归模型的优势,并通过两个关键机制实现知识传递。大量的实验表明,AMLNet 优于传统的自回归和非自回归模型,提供了一个提高准确性和加快计算速度的 - ICLR神经偏微分方程求解中的自回归复兴
“Message Passing Neural PDE Solver” by Brandstetter et al. designs a graph neural network that outperforms both Fourier - 超越 MLE:文本生成的凸学习
基于凸函数的训练目标提供了一种新颖的方法,使得文本生成模型能够聚焦于高概率输出,同时增强了自回归模型与非自回归模型的生成能力。
- 系统辨识的非渐近理论教程
该论文介绍了最近在系统辨识理论中发展起来的非渐近方法,重点介绍了在该领域的一系列问题中特别有用的工具,如覆盖技术、Hanson-Wright 不等式和自标准化马丁格尔方法,并使用这些工具对用于识别自回归模型中的参数的各种最小二乘估计器的性能 - 向量量化图自编码器
本文提出了一种基于图神经网络的离散自编码器,Vector-Quantized Graph Auto-Encoder (VQ-GAE),用于模拟图的分布,通过利用图神经网络的等变性、局部结构和全局结构,以离散向量化的方式将图对象映射到潜在空间 - SequenceMatch: 带回溯的自回归序列模型的模仿学习
研究提出了一个名为 SequenceMatch 的方法,将序列生成问题转化成了一种模仿学习问题,并采用回溯策略和特定的训练目标以优化文本生成过程中的错误,经实验证明,该方法在语言模型的文本生成任务中比 MLE 更加优秀。
- 利用潜在语言扩散模型生成多样化段落的规划器
本文提出了组合自回归生成模型与潜在语义扩散的 PLANNER 模型用于全局控制段落文本生成,并在各种条件生成任务上进行了评估。结果表明,该方法有效地生成了高质量的长篇文本。
- 方差稳定密度估计的异常检测
通过将正常样本的密度函数假设为在某些紧凑区域内是均匀的,减小方差放宽了对于特定数据的超参数调节要求,提出了基于改进密度估计的异常检测方案,并设计了一个方差稳定的密度估计问题,然后使用自回归模型学习了方差稳定分布,最后在 52 个数据集的广泛 - 使用简单序列先验的强化学习
使用信息熵的目标函数和可压缩动作序列作为先验,提出了一种新的强化学习算法,能够学习解决包含可压缩序列动作的任务。在一系列连续控制任务中表现比最先进的无模型方法更好,并且产生出强大的信息正则化代理,能够对噪声观测进行鲁棒控制和执行开环控制。
- SAMoSSA:带随机自回归噪声的多元奇异谱分析
使用多变量奇异谱分析(mSSA)和普通最小二乘法(OLS)算法,我们提出了一种名为 SAMoSSA 的新算法,可对时间序列数据进行分析,具有预测分析和模型识别功能。我们的算法可应对自回归噪音结构,提高数据处理的准确性达 5%至 37%。
- 重塑自回归图生成中的排序思路
本文提出了基于学习的排序方案来解决自回归模型中的图生成和排序问题,并通过实验证明该方案在各种图生成任务上的有效性,鼓舞未来工作进一步探索和发展学习排序方案。
- NLP 中的扩散模型:一项调查
本文对自然语言处理中的扩散模型进行了全面的综述,讨论了不同的模型形式、优势和局限性,以及自然语言生成、情感分析、主题建模和机器翻译等应用。与自回归模型相比,扩散模型具有在生成、插值、令牌级控制和鲁棒性方面的显着优势。未来的研究方向包括把 T - CVPR不是所有的图像区域都很重要:用掩码向量量化进行自回归图像生成
本研究提出了一种新的两阶段框架,包括掩蔽量化 VAE(MQ-VAE)和 Stackformer,在图像生成中减轻冗余感知信息的影响,实现了高效有效的图像生成。
- Flover: 一种用于高效自回归模型并行推理的时空融合框架
在深度学习领域,为了提高模型推理性能,文章提出了名为 Flavor 的时序融合框架,它可应用于各种推理场景,通过提供更细粒度的并行性和采用有效的内存洗牌算法,相对于 NVIDIA Triton FasterTransformer 等先进解决 - 带前瞻注意力的自回归建模
本文介绍了一种新颖的基于 Transformer 的自回归架构,通过根据某些提议分布外推过去的多个连续部分来估计下一个令牌的分布,并关注这些扩展字符串,以改进自回归模型的性能。
- CVPR朝向准确的图像编码:动态向量量化改进自回归图像生成
提出了一种新的两阶段框架,它使用动态量化 VAE 将图像区域编码为基于其信息密度的可变长度代码,以实现更准确,更紧凑的代码表示,从而解决了现有 VQ 基于自回归模型的固定长度编码问题,该方法通过一种新的堆叠 Transformer 架构和共 - 可解释并行 RCNN 以及新颖的特征表示在时序预测中的应用
本研究提出了一种新的特征表示策略 - shifting,利用并列的 RNN 和 CNN 框架进行分层,并采用跳过连接技术来提高模型性能,以解决时间序列预测中存在的历史和未来数据分离的限制,同时使用 Grad-CAM 算法提高模型的可解释性。
- 生物医学信号处理的自回归模型
该论文提出了一种基于超参数化损失函数的自回归模型框架,用于处理神经科学等领域中存在的时间序列数据误差和模型不确定性问题,并验证该方法能够成功去噪、重构系统参数,为脑机接口数据分析以及癫痫等脑部疾病的研究提供了新的方法。
- 多任务学习在开放域对话系统中的实证研究
研究使用辅助任务对自回归模型进行改进,提高其在开放域对话生成中的长期语境处理和一致性维护,结果在小型和中型的 GPT-2 模型上表明引入新的辅助任务虽然有所改进,但仍有发展空间。
- 多图卷积网络用于姿态预测
本文提出了一种基于多图卷积网络 (MGCN) 的三维人体姿势预测方法,该方法结合自然结构和序列注意力,同时捕获空间和时间信息,并在人体运动预测的基准数据集上表现出比现有方法更好的效果。