- TimeAutoDiff:结合自动编码器和扩散模型的时序表格数据合成
通过结合变分自动编码器(VAE)和去噪扩散概率模型(DDPM)的思想,我们提出了一种名为 TimeAutoDiff 的模型,用于生成时间序列表格数据。该模型能够处理各种类型的时间序列表格数据,具有良好的保真度和实用性,并且在生成速度上有显著 - 从自然语言解释中学习以实现通用的实体匹配
将实体匹配重新定义为条件生成任务,借助自然语言解释将大型语言模型的推理方式 “精简” 到较小实体匹配模型中,从而达到强大的性能表现。
- 条件幂等生成网络
我们提出了条件幂等生成网络(CIGN),这是一种新颖的方法,扩展了幂等生成网络(IGN)以实现条件生成。CIGN 通过引入条件机制来解决 IGN 的限制,使用户能够控制生成数据的内容。我们在理论上建立了 CIGN 的基础,概述了其范围、损失 - 从视频扩散先验中学习时间一致的视频深度
该研究旨在通过利用现有视频生成模型中的先验知识,将视频深度估计问题转化为条件生成问题,以降低学习难度并增强泛化能力。通过实证验证,作者提出了一种先优化空间层再优化时间层的训练策略,并通过滑动窗口策略在任意长的视频上进行推断,从而获得更具时间 - InstaDrag: 从视频中出现的快速准确基于拖动的图像编辑
InstaDrag 是一个快速方法,通过将拖拽编辑重新定义为条件生成任务,以及在训练时使用视频帧作为数据源,可以在大约 1 秒内实现高质量的拖拽式图像编辑。
- 简单的 LoRA 调整在注意力层上将改进您的扩散模型
将 LoRA 调节应用于注意力层而不改变 U-Net 结构的其他部分,提高了图像生成质量。
- 高效文本驱动的运动生成:通过潜在一致性训练
运动扩散模型通过运动潜变量的一致性训练提高运动生成性能,使用概率流常微分方程表达扩散过程,引入量化约束优化运动潜变量表示,提出条件生成方法并节省大量时间成本,实验结果表明该模型具有最先进的性能和较低的时间成本。
- 改进的无需训练的条件扩散模型的费舍尔信息
我们提出了一种利用费舍尔信息引导的扩散模型 (FIGD),通过引入费舍尔信息来估计梯度,以减少计算成本,并确保 FIGD 的泛化性,为基于信息论的无训练方法提供新的训练思路。实验结果表明,FIGD 能够更快地实现不同条件图像的生成而保持高质 - XC-Cache: 为高效 LLM 推理跨越关注缓存上下文
引入了受编码器 - 解码器结构启发的模型,利用交叉注意力将生成模型与参考文本进行条件化。这些模型仅训练少量添加的层,并在问答测试中表现出优异的条件生成能力,超越了上下文学习,并相对于标准 KV 缓存方法极大地减少了空间占用。
- ControlMol: 为分子扩散模型添加子结构控制
通过对扩散模型进行预训练,使用 ControlNet 思想进行条件分子生成,实现基于随机分割的亚结构数据生成有效且多样性更强的分子。
- 时间编织者:一种条件时间序列生成模型
基于异构元数据的时序生成,Time Weaver 模型通过利用分类、连续和时变变量显著提高时序生成,并创新性地提出了适用于时序领域的评估指标,证明在真实世界的能源、医疗、空气质量和交通数据集上,在下游分类任务中性能优于生成对抗网络(GANs - 扩展流匹配:一种具有广义连续方程的条件生成方法
本文基于流匹配理论开发了基于流匹配的条件生成理论,通过广义连续性方程数学框架,匹配矩阵场而非向量场,确保生成的条件分布的连续性,并通过实验和数学结果验证了我们的理论。
- 扩散语言模型是多功能的蛋白质学习器
该研究介绍了扩散蛋白质语言模型(DPLM),一种多功能的蛋白质语言模型,展示了对蛋白质序列具有强大的生成和预测能力。通过生成自监督离散扩散概率框架对进化规模的蛋白质序列进行可扩展的 DPLM 预训练,使 DPLM 展现出无条件生成结构合理、 - DiffPLF: 一种用于电动车充电负荷概率预测的有条件扩散模型
通过 DiffPLF 模型,对电动汽车充电进行概率负载预测,该模型能够根据历史数据和相关协变量明确地近似预测负载分布,并结合条件生成机制,通过任务导向的微调技术提高准确性和可靠性,实现复杂时间模式的可控生成。
- 推动自回归模型的 3D 形状生成能力与可扩展性
通过扩展自回归模型到三维领域并改进其容量和可扩展性,本文提出了一种名为 Argus3D 的新框架,利用离散表示学习基于潜在向量的三维形状生成,大大降低计算成本并保留几何细节,同时通过简单地连接各种条件输入来实现条件生成能力。经过广泛实验验证 - 潜在图扩散:一种在图上生成和预测的统一框架
我们提出了第一个框架,允许使用一个模型解决所有级别(节点、边和图)和所有类型(生成、回归和分类)的图学习任务。我们首先提出了潜在图扩散(LGD),它是一个生成模型,可以同时生成所有类别的节点、边和图级特征。我们通过将图结构和特征嵌入到潜在空 - 离散分布网络
通过使用层次离散分布生成多个离散样本点,逐渐拟合目标分布,这种离散分布的层次输出模式赋予了 DDN 两个有趣的特性:高度压缩表示和更一般的零样本条件生成。我们通过在 CIFAR-10 和 FFHQ 上进行实验验证了 DDN 及其有趣特性的有 - 阅读指导:从扩散特征中学习控制
我们提出了一种名为 Readout Guidance 的方法,用于通过学习的信号控制文本到图像扩散模型。该方法使用读取头,在每个时间步从预训练的冻结扩散模型的特征中提取信号。这些读出可以编码单一图像属性,如姿态、深度和边缘;或者编码多个图像 - 高效的多模态扩散模型:联合数据填充与部分共享 U-Net
通过使用部分共享 U-Net (PS-U-Net) 架构及新的有效的多模态采样方法,本研究成功开发出高质量的多模态文本和图像数据生成模型,同时具备与现有模型相比相当的大小、更快的训练速度、更快的多模态采样以及更灵活的生成。
- 扩散模型与指导梯度实现可控音乐制作
我们展示了如何从扩散模型中进行条件生成,以解决音乐制作中的各种现实任务,包括音乐音频的延续、修复和再生,不同音乐轨道之间的平滑过渡以及将样式特征传递给现有音频片段。