- $E^{3}$Gen:高效、表达丰富且可编辑的人物生成
介绍了一种名为 $E^3$Gen 的新型头像生成方法,采用 3D 高斯函数,将其编码到由 SMPL-X 参数模型定义的结构化 2D UV 空间上,实现了头像生成和全身姿势的控制和编辑。
- 面向多任务多模态模型的视频生成视角
通过构建多任务模型、保留高保真度的视频本机时空分词器、以及可解释的词汇术语与视觉观察之间的映射,我们的研究证明了多模态潜在空间设计的可行性,并提出了一种优于行业标准编解码器的视频本机时空分词器,从而在视频合成方面实现了语言模型超越扩散模型的 - 复杂系统动力学预测的生成学习
通过学习和演变系统的有效动力学,我们引入生成模型来加速复杂系统的模拟。在提出的 G-LED 中,高维数据的实例被降采样到一个更低维度的流形中,并通过自回归注意机制进行演变。反过来,贝叶斯扩散模型将这个低维流形映射到相应的高维空间,捕捉系统动 - DiffiT:用于图像生成的扩散视觉 Transformer
本文研究了视觉 transformer 在基于扩散的生成学习中的有效性,并提出了一种新的模型 Diffusion Vision Transformers(DiffiT),该模型在多个条件和无条件综合任务中取得了最新的基准成绩,生成了高保真度 - 高斯分布原型混合与生成模型相结合的可解释的图像分类
这篇论文介绍了一种新的原型分布生成学习方法,名为 MGProto,它使用高斯混合模型表示原型分布,并结合原型多样性目标函数来提高表示能力和减少冗余,同时利用其生成性质实现了有效的异常样本检测。实验结果表明 MGProto 在分类和异常样本检 - 张量网络的连续数据生成学习
我们引入了一种能够学习含有连续随机变量的分布的新型张量网络生成模型,首先在矩阵乘积态的背景下推导出通用表达能力定理,证明了该模型家族能够以任意精度逼近任何充分平滑的概率密度函数;然后在几个合成和真实世界数据集上对该模型的性能进行基准测试,发 - DiffSED:使用降噪扩散的声音事件检测
通过采用生成学习的角度来重新构建声音事件检测问题,我们的模型在训练中学习逆转噪声处理,从而能够从噪声查询中生成准确的事件边界,实验证明在 Urban-SED 和 EPIC-Sounds 数据集上,我们的模型在训练中具有 40% 以上的更快收 - 掩蔽变换器应用于扩散模型快速训练
本论文提出了一种使用掩码 Transformer 训练大型扩散模型的高效方法,实现了在不牺牲生成性能的情况下,仅使用 31%的训练时间达到与最先进的扩散变压器模型相同性能的效果。
- 通过深度条件生成学习对时间序列的马尔可夫属性进行测试
本文利用深度条件生成学习在高维时间序列数据中提出了一种非参数检验马尔可夫性质及推断马尔可夫模型阶数的方法,并通过模拟和三个数据应用程序证明了该方法的有效性。
- EMNLP使用生成式目标进行语句表示学习,而非对比式目标
本文提出了一种基于短语重构的生成式自监督学习目标,从而在获得上下文化标记级别表示的同时,有效获取句子级别表示,在句子结构的建模上进行了精细的设计,实验结果表明,该方法在语义检索和重排序任务上超越当前最先进的对比方法。
- 视频自监督学习综述
本篇综述论文讨论了自监督学习在视频领域的应用,主要归纳了四种不同的自监督学习方法,分别为预测任务、生成式学习、对比学习和跨模态协议,并讨论了现有方法的局限性和未来发展方向。
- MM面向密集无监督视频分割的 In-N-Out 生成学习
本文介绍了一种新的基于生成学习的视觉变形不变性技术,提高视频对象分割的准确性和稳健性。实验结果表明,该方法在两个数据集上都优于现有的最先进方法。
- 能量对比学习视觉表征
探索了一种基于能量的对比学习方法,将对比学习与基于能量的模型相结合,可以用于学习小型和中型数据集中的视觉表示,其在 MNIST、Fashion-MNIST、CIFAR-10 和 CIFAR-100 等数据集上都表现出了很好的结果,并相对于其 - 变分量子玻尔兹曼机
本文提出一种基于虚时间演化的变分量子 Gibbs 状态逼近方法,实现了与临近中期的量子计算机兼容的量子 Boltzmann 机械训练方法,同时支持任意参数哈密顿量的梯度下降求解,适用于生成学习与判别学习任务。
- 你的分类器实际上是基于能量的模型,你应该使用基于能量的模型的方法对待它
本文提出将标准的判别分类器重新解释为联合分布的能量模型,以提高校准性、鲁棒性和生成学习的绩效。
- 在大规模最优输运问题上的可扩展和高效计算
提出了一种名为 SPOT(Scalable Push-forward of Optimal Transport)的基于隐式生成学习的方法来解决 “最优传输”(Optimal Transport,OT)中的可扩展性问题,该方法通过引入参考分布 - 使用张量网络实现量子机器学习
本文提出一种基于张量网络的量子计算方法,用于解决当前在量子计算中机器学习所面临的挑战。在此方法下,经典计算和量子计算可共享同样的理论和算法基础,且张量网络电路在量子计算机模型的训练中具有高效节省的优势,并通过对手写识别模型的数值实验验证了其 - AAAI深度神经网络的生成学习
本文的研究旨在深度神经网络的生成式学习问题上提出一种中间方法,通过前向计算得出一个简化版的贝叶斯概率多层模型,并且运用转置的方法使得识别和生成网络更加符合数据的联合概率模型。通过实验发现,这种联合对组的生成对模型足够强大,可以很好地进行识别 - 学习视觉注意力生成模型
通过利用关注机制的生成学习框架,可以将图像中感兴趣的区域传递给生成建模的标准表征,并集中精力在感兴趣的对象上,从而建立新面孔的生成模型。