人类解析的深度学习技术:调查和展望
该论文介绍了 Renovating Parsing R-CNN (RP R-CNN) 模型,它采用了全局语义增强的特征金字塔网络和解析重新评分网络,以提高多人解析中的全局认知度和准确实例分割得分,并在 CIHP 和 MHP-v2 数据集上表现出优异的性能。
Sep, 2020
这篇论文研究了一项名为统一感知分析的新任务,通过开发 UPerNet 多任务框架和一种训练策略来实现从给定图像中识别尽可能多的视觉概念,最后在自然场景中应用训练网络来发现视觉知识。
Jul, 2018
本文研究了多人图像中的多人语义分割问题,提出了一个新的数据集 MHP 和一个基于深度学习的 Nested Adversarial Network (NAN) 模型来解决这个问题。该模型在多个数据集上取得了优秀的性能,并可应用于人类行为分析和自动驾驶等领域。
Apr, 2018
本文介绍了一种基于分层语义分割任务的人体解析方法,其使用设计的分级树结构来编码人体生理结构,并在一组内联的过程中生成准确的结果。实验结果表明该方法具有较高的准确性和可行性。
Dec, 2019
本篇文章介绍了一个名为 “Look into Person (LIP)” 的新的数据集,该数据集包含 50,000 多张具有 19 个语义部件标签的图像,是一个可扩展性、多样性和难度方面的重大进展,并且使用自监督学习方法解决了人体解析的问题。
Mar, 2017
本文介绍了 Semantic-Human 这一新颖方法,通过扩展 NeRF 以共同编码语义、外观和几何来实现 2D 语义标签,从而实现神经渲染方法下的人体解析,并在连续和新视图中实现一致的人体解析。
Aug, 2023
本文提出了一种名为 Parsing R-CNN 的用于解决实例级人体分析的端到端管道,其通过综合考虑区域方法的特征和人体的外观来同时处理一组人体实例,从而使其非常灵活高效,并在 CIHP(Crowd Instance-level Human Parsing)、MHP v2.0(Multi-Human Parsing)和 DensePose-COCO 数据集上优于所有最先进的方法,也在 COCO 2018 Challenge DensePose Estimation 任务中获得了第一名。
Nov, 2018
本论文提出了一种基于 Part Grouping Network 的多人解析方法,通过二元子任务实现语义部分分割与实例感知边缘检测,并在多个数据集上实现了优于当前状态 of-the-art 的表现。
Aug, 2018
本文提出了一种基于 segment-based parsing 管道的方法,利用人体姿势信息对人体进行语义区域划分,从而提高了部分提案的准确率,加速了推理并使得解析过程更规则化,经实验证明该方法相比现有技术具有更好的优越性能。
Aug, 2015
本论文提出了一种新的底部向上体系结构,以联合学习类别级人类语义分割和多人姿态估计来解决实例感知的人体部位解析的挑战任务。该框架利用不同人类细粒度上的结构信息,使人员分区的难度降低。通过将联合关联建模为最大权二分匹配,实现了可微分的解决方案,从而使我们的方法具有端到端的可训练性,并且允许将分组误差直接传播到多层次的人类表征学习中。
Mar, 2021