关键词conditional variational auto-encoder
搜索结果 - 11
- 离线强化学习的优势感知策略优化
离线强化学习通过利用脱机数据集来制定有效的智能体策略而无需在线交互,以克服行为策略所支持的适当保守约束来解决分布不匹配问题。本文引入了一种新的 Advantage-Aware Policy Optimization (A2PO) 方法,用于 - 基于变分自动编码器的深度学习技术用于填补反应 PIV 数据中的空缺
使用基于深度学习的条件变分自编码器 (CVAE) 技术填补燃烧系统中常见的粒子图像测速 (PIV) 测量中的空白,通过时间分辨率的可观测商业相关燃烧器中的缺失 PIV 场进行训练,通过对三组燃烧器操作条件数据集的重建速度场评估不同误差指标来 - CLUE: 离线强化学习的校准潜在指导
本文提出了一种基于专家数据提取内在奖励的方法,该方法利用了 Calibrated Latent Guidance (CLUE) 来消除离线 RL 中需要手动指定外部奖励的步骤,并在不同的离线 RL 任务中取得了良好效果。
- ACL基于短语级通用视觉表征的神经机器翻译
对比于其它多模式机器翻译 (MMT) 方法,我们提出了一种短语级别检索的 MMT 方法,从已有的文本 - 图像数据集中获得源输入的视觉信息,有利于缓解输入限制和数据稀疏的问题,并且通过条件变分自编码器可以更好地过滤多余的视觉信息和仅保留和短 - ACL神经跨语言摘要变分分层模型
本文提出了基于条件变分自编码器的层次模型,用于将一个语言的文档转化为另一个语言的摘要,从而解决了直接进行交叉语言摘要的挑战,实验证明这种方法比现有的方法更为有效和优越。
- 基于不确定性启发的 RGB-D 显著性检测
本文提出了一种基于不确定性的随机框架,通过学习数据标记过程实现 RGB-D 显著性检测,通过引入一个潜在变量来建模标记变化,包括一个生成器模型和一个推理模型,并采用条件变分自动编码器和交替反向传播技术来推断潜在变量。在六个挑战性的 RGB- - MMAMENet: 基于关注地图编码器网络的轨迹预测
提出了一种名为 AMENet 的端到端生成模型,使用注意力机制动态地建模了邻居交互信息,实现了准确和逼真的轨迹多路径预测,并在 Trajnet 和 InD 两个公共轨迹预测数据集上进行了验证。
- 可解释语音合成的全层次精细韵律建模
本文提出了一种基于 Tacotron 2 的分层、细粒度和可解释的潜变量模型,实现了 prosody 的多分辨率建模,并使用有条件的 VAE 结构对所有潜在维度进行分层约束,提升了模型的可解释性和分离性能。
- CLOTH3D: 服装三维人体
CLOTH3D 是第一份大规模的 3D 服装人体序列的综合性合成数据集,并提供了基于条件变分自编码器和图卷积的生成模型,实现了在任何姿势和形状下逼真生成 3D 服装。
- 一种用于建模多尺度模糊的层次概率 U-Net
提出一种用于鲜明可辨的多级细节分割的分割网络,Hierarchical Probabilistic U-Net,它采用基于条件变分自编码器的分层潜空间分解,可以在自动分离多个规模的独立因素的同时,学习跨规模的复杂结构分布,从而实现对医疗扫描 - 使用卷积神经网络学习高层先验知识进行语义分割
本文提出了一种融合高层次信息以进行语义图像分割的卷积神经网络,使用三层生成结构包括高级编码,中级分割和低级图像进行全局信息分割,使用条件变分自编码器建立这三层之间的连接,提高了分割的精确度和性能。