利用扩散模型对手写数据进行建模

ICLRApr, 2023

利用扩散模型对手写数据进行建模

ChiroDiff: Modelling chirographic data with Diffusion Models

Ayan Das, Yongxin Yang, Timothy Hospedales, Tao Xiang, Yi-Zhe Song

TL;DR本文介绍了一种名为 “ChiroDiff” 的非自回归模型，它学会了捕捉整体概念，能够更好地处理手写、素描等实时几何构造数据，并且还能够灵活地实现很多重要的下游应用。研究表明，该模型在相关数据集中的定量与定性评估中表现良好，并且能够更好地或达到竞争对手的水平。

Abstract

generative modelling over continuous-time geometric constructs, a.k.a such as handwriting, sketches, drawings etc., have been accomplished through autoregressive distributions. Such strictly-ordered discrete factorization however falls short of capturing key properties of →

generative modelling chirographic data denoising diffusion probabilistic models temporal sampling conditional sampling

发现论文，激发创造

离散状态空间中的结构去噪扩散模型

本文提出了离散去噪扩散概率模型（D3PM），用于离散数据的扩散式生成模型，包括了仿真高斯核、嵌入空间中基于最邻近、引入吸收状态等过渡矩阵。研究表明过渡矩阵的选择对图像和文本领域下的生成模型结果至关重要，且提出的新损失函数在字符级别文本生成上取得了很好的效果。

Jul, 2021

改进降噪扩散概率模型

通过对 DDPM 模型进行简单修改，可以在保持高质量样本的同时达到具有竞争力的对数似然值，并学习反向扩散过程的方差，从而使用数量级更少的正向传递采样。使用精度和召回率比较 DDPM 和 GAN 模型的性能，并证明这些模型的样本质量和似然值可以与模型容量和训练计算平稳地提高。

Feb, 2021

Diffusion-TS: 通用时间序列生成的可解释扩散

Denoising diffusion probabilistic models (DDPMs) are becoming the leading paradigm for generative models. In this paper, we propose Diffusion-TS, a novel diffusion-based framework that generates high-quality multivariate time series samples using an encoder-decoder transformer with disentangled temporal representations, aiming to satisfy both interpretability and realness.

Mar, 2024

硬件受损通信系统的去噪扩散概率模型：朝着无线生成 AI

本文提出了基于去噪扩散概率模型的无线通信方案，旨在解决实际应用中的硬件损伤、信道失真和量化误差等非理想因素，提供低信噪比下的网络韧性、对不同硬件损伤水平和量化误差的近不变重建性能，以及抵抗非高斯噪声的强大分布外表现，并通过余弦相似度和均方误差（MSE）评估与传统深度神经网络（DNN）接收机相比的超过 25 dB 改进的重建性能。

Oct, 2023

借助基于 Glyph 条件去噪扩散概率模型生成的训练样本改进手写 OCR

提出一种 DDPM 概率模型用于生成手写体图像样本，并引入渐进式数据过滤策略，可将 OCR 模型在 IAM 基准任务上的错误率相对降低 45%。

May, 2023

六个简单步骤的去噪扩散概率模型

通过六个简单步骤清晰陈述，简化并阐明噪声扩散概率模型（DDPM）的构建及其工作原理。

Feb, 2024

针对风格化行走合成的去噪扩散概率模型

本文提出了一种使用去噪扩散概率模型（DDPM）生成风格化人体运动的框架，将两个任务集成到一个管道中，与传统运动合成方法相比，具有更高的风格多样性，实验结果表明，该系统可以生成高质量且多样化的行走动作。

Sep, 2022

ShiftDDPMs: 探索通过平移扩散轨迹来探索条件扩散模型

本研究提出了一种新的有条件扩散模型 ShiftDDPMs，通过将条件引入正向过程，为每个条件分配一个独特的扩散轨迹，并通过定向规则来实现条件建模，从而提高模型的学习能力和生成效果。在图像合成方面进行了广泛的实验，证明了 ShiftDDPMs 的可行性和有效性。

Feb, 2023

离散扩散概率模型用于符号音乐生成

本文提出了一种使用 Discrete DDPMs (D3PMs) 直接生成 Polyphonic Symbolic Music 的方法，并展示了该模型的高质量和灵活的属性，并警示无法通过量化指标完全评估样本质量。

May, 2023

DiffAR: 去噪扩散自回归模型用于原始语音波形生成

本文提出了一种基于扩散的概率端到端模型，用于生成原始语音波形，该模型通过自回归的方式顺序生成重叠帧，可以实现无限语音时长的合成，并保持高保真度和时间连贯性，通过直接处理波形具有优势，可以创建局部声学行为，同时该模型是随机的，生成略有差异的波形变体，实验结果表明相较于其他最先进的神经语音生成系统，所提出的模型具有更高的合成质量。

Oct, 2023