RHanDS: 用解耦的结构和风格指导来改善生成图像中的畸形手部

Apr, 2024

RHanDS: 用解耦的结构和风格指导来改善生成图像中的畸形手部

RHanDS: Refining Malformed Hands for Generated Images with Decoupled Structure and Style Guidance

Chengrui Wang, Pengfei Liu, Min Zhou, Ming Zeng, Xubin Li...

TL;DR通过使用条件扩散框架来改善手部结构及风格一致性问题，本文提出了一种基于扩散的手部细化框架 RHanDS，利用解耦的结构和风格引导对手部区域进行优化，评估结果显示 RHanDS 可以有效地改善手部结构和风格问题。

Abstract

Although diffusion models can generate high-quality human images, their applications are limited by the instability in generating hands with correct structures. Some previous works mitigate the problem by considering hand structure yet struggle to maintain →

diffusion models hand structure style consistency conditional diffusion-based framework multi-style hand dataset

发现论文，激发创造

HandRefiner: 基于扩散的条件修复技术对生成图像中的畸形手进行修复

我们的研究引入了一种轻量级的后处理方案 HandRefiner，通过一种条件修复方法来纠正生成图像中畸形的手部，同时保持图像其他部分的原貌。我们利用手部网格重建模型，确保生成图像中手指数量和手部形状正确，同时可以适应所期望的手部姿态。通过利用控制网络模块将正确的手部信息重新注入到生成失败的图像中，我们改进了手部生成的质量。实验证明，HandRefiner 能够在定量和定性方面显著提高生成质量。

Nov, 2023

HanDiffuser: 使用真实手表现生成文本 - 图像

HanDiffuser 是一种基于扩散的新型架构，通过在生成过程中注入手部嵌入信息，生成具有逼真手部的图像。它包括两个组件：Text-to-Hand-Params 扩散模型用于从输入文本生成 SMPL-Body 和 MANO-Hand 参数，以及 Text-Guided Hand-Params-to-Image 扩散模型用于以先前组件生成的提示和手部参数为条件合成图像。我们在学习和推断期间综合考虑了手部表达的多个方面，包括 3D 形状、关节级手指位置、方向和屈伸状态，以实现稳健学习和可靠性能。我们进行了大量定量和定性实验，并进行了用户研究，证明了我们的方法在生成具有高质量手部的图像方面的有效性。

Mar, 2024

帮助扩散模型：改进条件人类图像生成的两阶段方法

我们引入了一种新颖的姿势条件的人体图像生成方法，将生成过程分为两个阶段：手的生成和在手周围绘制身体。我们将手生成器训练在多任务设置中，以产生手图像及其相应的分割掩模，并将训练后的模型用于生成的第一阶段。然后，在第二阶段中使用改进的 ControlNet 模型来绘制生成的手周围的身体，产生最终的结果。我们引入了一种新颖的混合技术，在第二阶段中保留手部细节，以一种连贯的方式结合两个阶段的结果。实验评估证明了我们提出的方法在姿势准确性和图像质量上优于现有技术，在 HaGRID 数据集上得到验证。我们的方法不仅提高了生成手部的质量，还提供了对手势的改进控制，推进了姿势条件的人体图像生成的能力。

Mar, 2024

DiffHand: 基于扩散模型的端到端手部网格重建

利用一种基于扩散的手部三维网格重建框架 ——DiffHand，利用噪声模拟中间手网格的不确定性分布进行渐进式去噪过程，设计跨模态解码器来更好地模拟手顶点的连通性，从而达到优于先前方法 5.8mm PA-MPJPE 的最优表现。

May, 2023

基于结构解耦和双重敌对鉴别的半监督手部外观恢复

该研究提出了一种基于半监督学习的框架，使用图像转换技术从含有标记的手部动作捕捉数据集（MoCap）中恢复真实纹理，实现了裸手结构和外观的分离，成功地生成了逼真的手部外观图像。

Mar, 2023

一张 RGB 图像交互式双手重建的解耦迭代细化框架

本文提出了一个分解迭代框架来实现像素对齐的手部重建，同时有效地建模手部之间的空间关系，利用图卷积网络和变压器在 3D 联合特征空间中进行手部内部和交互信息交互，并通过在两个特征空间中进行多个交替增强来实现精确和稳健的相互作用手部重建。与所有现有的两只手重建方法相比，我们的方法在 InterHand2.6M 数据集上的表现都有了很大的提高。同时，我们的方法展现了对野外图像的强大的泛化能力。

Feb, 2023

DeepHandMesh：一种弱监督深度编码器 - 解码器框架，用于高保真度手部网格建模

本研究提出一种基于弱监督深度编码器 - 解码器框架的高保真手部网格模型，通过使用 3D 关节点坐标和多视角深度图等多种较弱监督手段，避免了对地面真实网格的依赖，并引入穿透避免损失来提高模型真实性，进一步表明所提出的 DeepHandMesh 方法在手部模型重建方面的有效性。

Aug, 2020

HACD：单目手持物体重建的手部感知条件扩散

通过使用概率点云去噪扩散模型，我们提出了一种面向单眼手持物体重建的手感知条件扩散方法（HACD），该方法通过手 - 物体交互的语义和几何角度进行建模，通过手顶点先验将部分去噪点云的质心偏移限制在一个范围内，并通过增强局部特征投影的稳定性和精度来提高形状的重构稳定性和精度，实验证明我们的方法在 ObMan、HO3D 和 MOW 数据集上超过了所有现有方法。

Nov, 2023

生成模型的带注释手部数据

通过在训练图像中增加三个额外通道，我们提出了一种新的生成模型训练框架，大大提高了生成模型创建手图像的能力。我们通过在合成手图像数据集和包含手部的真实照片上展示了这种方法，并通过使用现成的手部检测器对指关节识别的置信度提高来衡量生成手部图像的质量改进。

Jan, 2024

HOIDiffusion: 生成真实的三维手物体交互数据

利用 HOIDiffusion 方法生成了逼真且多样化的三维手物体交互数据，并将其用于学习 6D 物体位姿估计，提高感知系统的效果。

Mar, 2024