利用扩散模型对手写数据进行建模
本文提出了离散去噪扩散概率模型(D3PM),用于离散数据的扩散式生成模型,包括了仿真高斯核、嵌入空间中基于最邻近、引入吸收状态等过渡矩阵。研究表明过渡矩阵的选择对图像和文本领域下的生成模型结果至关重要,且提出的新损失函数在字符级别文本生成上取得了很好的效果。
Jul, 2021
通过对 DDPM 模型进行简单修改,可以在保持高质量样本的同时达到具有竞争力的对数似然值,并学习反向扩散过程的方差,从而使用数量级更少的正向传递采样。使用精度和召回率比较 DDPM 和 GAN 模型的性能,并证明这些模型的样本质量和似然值可以与模型容量和训练计算平稳地提高。
Feb, 2021
Denoising diffusion probabilistic models (DDPMs) are becoming the leading paradigm for generative models. In this paper, we propose Diffusion-TS, a novel diffusion-based framework that generates high-quality multivariate time series samples using an encoder-decoder transformer with disentangled temporal representations, aiming to satisfy both interpretability and realness.
Mar, 2024
本文提出了基于去噪扩散概率模型的无线通信方案,旨在解决实际应用中的硬件损伤、信道失真和量化误差等非理想因素,提供低信噪比下的网络韧性、对不同硬件损伤水平和量化误差的近不变重建性能,以及抵抗非高斯噪声的强大分布外表现,并通过余弦相似度和均方误差(MSE)评估与传统深度神经网络(DNN)接收机相比的超过 25 dB 改进的重建性能。
Oct, 2023
提出一种 DDPM 概率模型用于生成手写体图像样本,并引入渐进式数据过滤策略,可将 OCR 模型在 IAM 基准任务上的错误率相对降低 45%。
May, 2023
本文提出了一种使用去噪扩散概率模型(DDPM)生成风格化人体运动的框架,将两个任务集成到一个管道中,与传统运动合成方法相比,具有更高的风格多样性,实验结果表明,该系统可以生成高质量且多样化的行走动作。
Sep, 2022
本研究提出了一种新的有条件扩散模型 ShiftDDPMs,通过将条件引入正向过程,为每个条件分配一个独特的扩散轨迹,并通过定向规则来实现条件建模,从而提高模型的学习能力和生成效果。在图像合成方面进行了广泛的实验,证明了 ShiftDDPMs 的可行性和有效性。
Feb, 2023
本文提出了一种使用 Discrete DDPMs (D3PMs) 直接生成 Polyphonic Symbolic Music 的方法,并展示了该模型的高质量和灵活的属性,并警示无法通过量化指标完全评估样本质量。
May, 2023
本文提出了一种基于扩散的概率端到端模型,用于生成原始语音波形,该模型通过自回归的方式顺序生成重叠帧,可以实现无限语音时长的合成,并保持高保真度和时间连贯性,通过直接处理波形具有优势,可以创建局部声学行为,同时该模型是随机的,生成略有差异的波形变体,实验结果表明相较于其他最先进的神经语音生成系统,所提出的模型具有更高的合成质量。
Oct, 2023