关键词vector quantized variational autoencoders
搜索结果 - 7
- 离散潜在码的低秩适应轨迹预测
运用矢量量化变分自编码器(VQ-VAEs)和基于扩散的预测模型,通过离散潜在空间和实例级编码矢量的动态调整,实现轨迹预测的准确性和多样性,达到了三个标准基准测试的最新性能水平。
- 将预训练语言模型与物理层通信集成
基于设备的人工智能通信通过物理层通信功能、向量量化变分自动编码器和预训练编码解码变压器的融合,实现了传输大小减少 50%,在标准化的 3GPP 通道模型下表现出了显著的泛化能力和噪声鲁棒性。
- 利用变压器量化变分自编码器改进离散潜空间中的语义控制
通过使用 Vector Quantized Variational AutoEncoders (VQVAEs) 内的离散潜空间来提高 Transformer-based VAE 中的语义控制和生成性能,我们提出了一种新型模型 T5VQVAE - MoConVQ:基于可扩展离散表示的统一物理运动控制
利用可扩展的离散表示,我们提出了 MoConVQ,这是一个新颖的基于物理的运动控制统一框架,通过在大型无结构数据集上学习运动嵌入,实现了高效的运动表征,展示其对各种应用的多样性和鲁棒性,例如通用跟踪控制、基于潜在运动表示的交互式角色控制、自 - EdVAE:使用证据离散变分自动编码器缓解码书塌陷
提出了一种名为 EdVAE 的模型,通过使用证据深度学习(EDL)来解决 dVAE 的代码书坍塌问题,同时提高重建性能和代码书使用率。
- 利用 VQVAE 模型预测视频
本文提出了一种基于 VQ-VAE 的视频预测方法,将高分辨率视频压缩为一组分层多尺度离散潜在变量,然后应用可扩展自回归生成模型,相对于先前的工作,更关注大规模多样化的数据集,并使用人工评估验证了其效果。
- ECCV在自回归图像生成中引入强化对抗学习
使用基于策略梯度优化的强化对抗学习 (RAL),结合 GAN 启发的对抗损失,实现了图像生成中自回归模型的敌对性学习,提高了生成图像的质量和多样性。该方法在合成和真实数据集上都取得了显著的改善,并在 64*64 图像分辨率上实现了 Cele