- 通过力导 SE (3) 扩散模型生成蛋白质构象
我们提出了一种力导向的 SE (3) 扩散模型 ConfDiff,用于蛋白质构象的生成,该模型融合了力导向网络和基于数据的评分模型,能够生成具有多样性且高保真性的蛋白质构象。实验证明,我们的方法在多种蛋白质构象预测任务中优于现有方法。
- 生成人工智能的挑战与机遇
我们旨在识别现代生成 AI 范例中尚未解决的主要挑战,以进一步增强其能力、多样性和可靠性,并为研究人员提供有价值的见解,以探索更有成效的研究方向,从而促进更强大和可访问的生成 AI 解决方案的发展。
- EMNLP基于矢量量化提示学习的释义生成
通过利用预训练模型和实例相关提示,本文提出生成多样且高质量的复述词句的方法,使用向量量化的提示来控制预训练模型的生成。实验表明此方法在三个基准数据集上取得了最新的最佳结果,包括 Quora、Wikianswers 和 MSCOCO。一旦被接 - 扩散训练的样本高效性
评分扩散模型是深度生成建模图像的最流行方法,其理论和实证性能表现出有效采样、$L^2$ 精确评分估计、样本复杂度和 Wasserstein 准确性。
- 去噪扩散模型中的头部旋转
利用噪声扩散模型,通过嵌入技术在人脸旋转方面实现了显著的操作和编辑,保留了个体的显著特征。
- 从只包含状态序列中学习非 Markov 决策制定
本文研究了一种在非 Markov 决策过程下进行深度生成建模的模型,在无法观察到动作的情况下进行模仿学习和决策制定。
- DiMSam:部分可观察性下任务与动作规划的扩散模型采样器
本文介绍了将深度生成建模与任务规划相结合的方法,以解决在未知环境中的自主机器人操作规划中运用传统 TAMP 方法中存在的问题。通过使用扩散模型学习约束条件和采样器,并将其与 TAMP 求解器组合使用以满足计划中的约束条件。同时,为了在这些约 - 变分扩散自编码器:具有无条件扩散先验的深层潜变量模型
采用扩散模型集成编码器和无条件扩散模型的得分函数,消除了 VAE 图像模糊的问题,并显著提高了性能。
- 表格数据中的缺失值插值扩散模型
本文提出了一种用于 Tabular 数据的基于条件分数的扩散模型方法(TabCSDI),并研究了热点问题中的三种处理技术。实验结果表明与现有方法相比,TabCSDI 是有效的,同时也强调了分类嵌入技术的重要性。
- ICLR分层切片瓦烧斯坦距离
本文提出了一种新的测量两个概率分布距离的方法 -- 分层切片 Wasserstein 距离(HSW), 通过研究这种方法的理论性质以及在一些数据集上的比较,我们发现 HSW 在计算代价和生成质量上优于传统的 Sliced Wasserste - ICMLGFlowNets 与更多模型的统一生成模型
探讨了深度生成模型和 GFlowNet 框架之间的关系,从 Markovian 规划的角度提供了训练和推理算法统一的方式,并给出了实践验证的优化建议。
- WaveFake: 一份数据集,用以方便音频 Deepfake 检测
本文介绍了一些用于分析音频信号的常见信号处理技术。我们提供了一个新的数据集,并采用了两个基线模型,以便进一步研究深层次的生成建模在音频信号领域的应用。
- 使用前向 - 后向 SDE 的 Schrödinger 桥可能性训练理论
本文提出了一种新的计算框架,基于正向 - 反向随机微分方程理论,用于似然训练 Schr"odinger Bridge 模型,并展示了该优化原则具有与深度生成模型现代训练技术相适应的适用性,实现了对 MNIST、CelebA 和 CIFAR1 - ICLR反事实生成网络
通过深度生成建模,我们将图像生成过程分解成独立的因果机制,从而产生反事实图像,提高了模型的新颖性和可解释性。在 MNIST 和 ImageNet 上的实验表明,这些反事实图像能够提高模型的抗干扰性,而且这个模型能在单 GPU 上高效训练。
- ICLR通过判别器梯度流完善深度生成模型
通过熵正则化的 f - 散度梯度流技术,可以提高生成数据的质量,避免了浪费的样本拒绝,可以应用于各种生成系统,并取得了显著的效果优于 DOT 和 DDLS 方法。
- EMNLP向实体引导的文本生成中注入实体类型
本文旨在在解码阶段对实体类型进行建模,以生成准确的上下文词汇,实验表明注入类型在实体提及生成过程中的表现优于现有的类型嵌入拼接基线。
- 反馈循环自编码器视频压缩
本研究提出了一种新的基于已有组件的网络结构用于快速学习视频压缩,针对现有方法的图形概率模型进行了分析并指出了实验评估中观察到的时间一致性和颜色偏移的问题,并提出了解决这些问题的方向。
- 深度学习在分子设计中的应用 - 现状综述
文献的主要内容是深度生成建模技术被应用于分子生成和优化,包括使用递归神经网络、自动编码器、生成对抗网络和强化学习等四种技术,并探讨了这些技术的数学基础和优缺点,内容涉及到分子表示和设计中的多个方面。
- 基于随机生成先验知识的可证收敛压缩感知方案
本文介绍了一种通过神经网络的深度生成模型来提供低维参数化图像或信号流形的方法, 证明了其在噪声的压缩感知方面的收敛算法,其样本复杂度与先前的稀疏方法相比具有线性的优越性和改进的潜力。
- ICCVTrajectron:具备动态时空图的概率多智体轨迹建模
研究人员开发了一种基于图结构的 Trajectron 模型,利用递归序列建模和变分深度生成建模来预测多个代理的未来轨迹,通过多个数据集的结果表明其性能达到了最佳,并引入了一个新的指标用于比较输出分布的模型。