探索姿态引导的人物图像生成的双重任务相关性
本论文提出了新颖的姿势引导人物生成网络(PG2),该网络可以基于人的图像和新颖的姿态来合成人体图像。PG2的生成框架明确利用了姿势信息,并包含两个关键阶段:姿势整合和图像细化。实验表明,该模型可以生成高质量、具有令人信服细节的人体图像。
May, 2017
本文介绍了一种称为MultiPoseNet的新型底层多人姿态估计架构,它结合了多任务模型和新型分配方法,可同时处理人物检测、关键点检测、人物分割和姿态估计问题,并在COCO关键点数据集上超越了所有先前的底层方法,具有更高的精度和更快的速度,在至少4倍的速度下与最佳的自上而下方法相当。
Jul, 2018
通过改进下联式方法,提出了一种改进的多人姿势估计方法,该方法使用更直观却更合理的表示方法,具有 attention 机制的改进型叠叠层沙漏网络,专门用于 hard keypoint 和 keypoint 关联挖掘的新型 Focal L2 Loss 和用于将检测到的关键点分组为单个姿势的强大贪婪关键点分配算法,平均精度比基准线高约 15%,与 MS-COCO 测试数据集上的最新技术相当。
Nov, 2019
本文提出“可微分的全局流本地注意力框架”,以空间转换输入,实现人像生成和动画等多项任务,同时通过建模时间一致性,生成协调的视频,该框架在多项任务中表现优异,包括新视角合成和面部图像动画。
Aug, 2020
本文介绍了一种基于结构感知流的方法,利用语义部分将人体分解,来应对人物姿态变换并生成高质量图像,网络模块能够有效地捕捉人体局部和全局语义特征,实验结果表明,该方法在生成高质量图像方面胜过其他方法。
Feb, 2021
该研究提出了一种基于多头注意力机制和部位分离综合的人体图像合成方法,该方法能够更好地在保持风格的情况下实现从一种姿势转换到另一种姿势,并且在Market-1501和DeepFashion数据集上表现良好。
Oct, 2022
本研究提出了一种基于循环姿态对齐和梯度引导的方法,可以生成具有真实外观和无瑕疵姿态转移的人物图像。经过广泛的实验证明,该方法能够在复杂场景下生成具有真实感的姿态转移,并且通过人工评测证明了其有效性。
Oct, 2023
本研究解决了现有基于扩散模型的人像生成方法在姿势一致性方面的不足。我们提出了一种利用姿势先验的图关系框架,通过构建姿势先验与扩散模型潜在表示之间的图拓扑结构,学习姿势部位间的内在关联。实验结果表明,该方法在姿势平均精度上相比最新基准模型提高了9.98%。
Aug, 2024
本研究解决了现有姿态引导人物图像合成方法在野外样本中表现不佳的问题,尤其是在标签三元组数据稀缺的情况下。我们提出了一种名为OnePoseTrans的新方法,通过引入视觉一致性模块(VCM),结合面部、文本和图像嵌入,实现了在仅有单张源图像的情况下的高质量姿态迁移结果。研究表明,该方法在保持外观一致性方面具有显著优势,定制模型的速度可达48秒。
Sep, 2024