- 基于滑动顺序 CVAE 和时变社交感知重新思考的轨迹预测
本文提出了一种名为 CSR 的新型轨迹预测方法,由串联的条件变分自动编码器模块和社交感知回归模块组成。实验结果表明,与现有技术相比,在斯坦福无人机数据集(SDD)和 ETH / UCY 上,该方法的表现提高了约 38.0%和 22.2%。
- 通过记忆增强流重构和流引导帧预测的混合视频异常检测框架
本文提出了 $ ext {HF}^2$-VAD,这是一个混合框架,无缝地融合了流重建和帧预测,以处理视频异常检测。通过使用多级内存模块和跳过连接的自动编码器为正常光流模式进行记忆来识别异常事件,并且利用条件变分自动编码器,根据先前的几个帧预 - 使用条件变分自编码器从语音音频生成多样化手势
通过 split cross-modal 潜变量为 shared 和 motion-specific 两部分,结合 mapping network, relaxed motion loss, bicycle constraint 和 div - IJCAI具有多个可控属性的渐进式开放域响应生成
本文提出了一个 Progressively trained Hierarchical Encoder-Decoder (PHED) 方法,该方法使用 Conditional Variational AutoEncoder (CVAE) 和 - 利用自分离条件变分自编码器生成相关和连贯的对话回应
通过引入自身分离的条件变分自编码器(SepaCVAE),将组信息引入到规范化的潜变量中,进一步增强了 CVAE 通过提高响应的相关性和连贯性同时保持它们的多样性和信息量在开放领域对话生成任务中的性能。
- 面向驾驶信号的全身化身
本文提出了一种基于学习的方法,可以使用不完整的驾驶信号,如人体姿势和面部关键点,来建立全身化身,从而实现高质量的人类几何和视角相关的外观表现,同时通过分离驾驶信号和生成因素来提高可驾驶性和泛化性,还提出了一种可学习的局部压缩驾驶信号方法,以 - ICCVHuMoR: 坚韧姿态估计的 3D 人体运动模型
引入了 HuMoR:一种用于鲁棒估计时间姿态和形状的 3D 人体运动模型。该模型是一个表达能力强的条件变分自编码器生成模型,学习了运动序列每一步姿态变化的分布。通过灵活的优化方法,可以利用 HuMoR 运动先验知识从模糊的观察中鲁棒地估计出 - 多对一映射的循环一致性训练:Fork or Fail
本文提出了一种基于条件变分自编码器的方法来解决循环一致训练在存在多对一或满射映射时的问题,可以在两个方向上最小化重建误差并且可以获得现实输出多样性,并通过合成图像数据集和自然语言生成实验验证其有效性。
- ICCV基于似然的轨迹预测多样性采样
本文提出了一种基于概率建模的多模式数学预测的新方法:Likelihood-Based Diverse Sampling(LDS),通过使用预训练的流模型和优化目标函数以提高轨迹样本的质量和多样性,可以明显提高模型预测的准确性和数据生成的有效 - ICML条件变分自编码器进行异常检测
本文探讨了如何使用变分贝叶斯和变分自编码器(VAEs)进行异常检测(AD)任务,提出了一个新的方法来处理具有层次结构的数据。该方法在经典机器学习基准测试和监测 CERN 大型强子对撞机(LHC)实验的触发系统等应用中表现出卓越的性能。
- EMNLP一个具有主题知识图的情感可控主题 - 文章生成器
采用条件变分自动编码器框架,提出一种情感可控的主题到短文生成器,名为 SCTKG,其利用主题知识图谱增强解码器,可有效生成与主题相关、流畅和多样化的短文。
- BiTraP: 双向行人轨迹预测与多模态目标估计
本论文介绍了一种基于条件变分自编码器的双向多模态轨迹预测方法 BiTraP,该方法采用目标条件化方法和双向编 / 解码器结构以提高长期轨迹预测准确性,其在第一人称视角和鸟瞰视角均表现良好,比最先进的轨迹预测方法提高了约 10-50%。研究还 - CVPR生成变分自编码器无监督真实图像超分辨率
本文提出了基于生成模型的感知图像超分辨率方法,结合变分自编码器实现了联合降噪和超分辨率,使用条件生成对抗网络实现了具有良好视觉效果的图片超分辨率,并通过实验验证了该方法的有效性。
- CVPR通过过完备分布实现广义零样本学习
该研究提出了一种通过使用 CVAE 生成超完备分布并在其上使用 OBTL 和 CL 来改进 DNN 在 ZSL 设置下的性能的框架,并在 SUN、CUB 和 AWA2 三个公开基准数据库上进行了评估,结果表明生成超完备分布并迫使分类器从重叠 - StructEdit:学习结构形状变化
本研究提出了一种以不同形状之间的形状差异作为主要对象并将其编码到自己的潜在空间中的方法来进行 3D 内容创建,该方法基于条件变分自编码器,对形状进行编码和解码,以实现对形状差分的压缩表示,分层部分结构的不均匀性以及修改抽象和转移。
- EMNLP短文本对话生成中的离散 CVAE
本文研究主要通过在条件变分自编码器中引入具有显式语义意义的离散潜变量,从而提高短文本对话生成质量并增加多样性。实验证明,该模型在自动评估和人类评估中表现出色。
- ICMLAUTOVC: 仅基于自动编码器损失的零样本语音风格转换
本文提出了一种新的艺术风格转换方案,它仅涉及一个带有仔细设计的瓶颈的自编码器,通过仅通过自重构损失进行训练,我们形式证明这种方案可以实现分布匹配的风格转换。 我们基于此方案提出了 AUTOVC,并在非平行数据的多对多语音转换中实现了最先进的 - 对抗性变分自编码器在脑机接口中的迁移学习
本研究介绍了对抗神经网络在大脑 - 计算机界面(BCI)传递学习中作为表征学习的新方法。该方法旨在通过同时训练条件变分自动编码器(cVAE)和对抗网络来学习主体不变的表示,我们使用浅卷积结构实现 cVAE,并将学习的编码器转移到未见 BCI - 使用关注对抗生成网络对最先进人脸识别系统进行攻击
本文研究如何通过使用生成网络和注意力机制来进行对抗攻击,以误导面部识别网络将某人误认为目标人物而非将其错判不明显的机制。
- 通过建模、过滤和优化来提高对话的连贯性和多样性
本文介绍了三种增强现有编码器 - 解码器模型的方法,以有效地模拟连贯性并促进输出多样性,它们在 OpenSubtitles 语料库上的实验表明,与竞争神经模型相比,在 BLEU 分数以及连贯性和多样性度量方面均有极大改善。