区域掩模的演员 - 动作语义分割 | BriefGPT

Jul, 2018

区域掩模的演员 - 动作语义分割

Actor-Action Semantic Segmentation with Region Masks

Kang Dang, Chunluan Zhou, Zhigang Tu, Michael Hoy, Justin Dauwels...

TL;DR本文提出了一种基于区域的演员 - 动作语义分割方法，通过实例分割算法的区域掩模，避免对掩模内的像素进行独立标记，达到了一致的动作标记并在 A2D 数据集上得到了显著的性能提升。

Abstract

In this paper, we study the actor-action semantic segmentation problem, which requires joint labeling of both actor and action categories in video frames. One major challenge for this task is that when an actor performs an action, different body parts of the actor provide different typ

actor-action semantic segmentation region-based segmentation instance segmentation two-stream network performance improvement

发现论文，激发创造

文本视频分割的演员和行为模块化网络

本文提出了一种基于文本的视频分割方法，通过引入一个新的演员和动作的模块化网络，解决了语义不对称问题，同时提出了时间提案聚合机制，获得了单帧分割和全视频分割的最先进性能。

Nov, 2020

从句子中分离演员和动作的视频分割

该研究旨在实现对视频内容中演员和他们的动作进行像素级别的分割。通过自然语言输入句子推断分割，以实现在同一超级类别中对精细的演员进行区分，并识别演员和动作实例，以及分割超出演员和动作词汇的成对内容。提出了一种用于视频像素级别的演员和动作分割的全卷积模型，采用编码器 - 解码器结构进行优化。扩展了两个流行的演员和动作数据集，并添加了超过 7,500 个自然语言描述，展示了基于句子的分割的潜力、我们模型的泛化能力和其与现有技术相比在传统演员和动作分割方面的优势。

Mar, 2018

带有分组过程模型的演员 - 动作语义分割

提出了一种新模型，将局部标签 CRFs 与分层的图像超像素分解相结合，以在视频理解的问题中提高其有效性，该模型动态地连续在推理过程中交换信息并有助于提高高阶组的能力，在最新的大规模视频数据集上表现出相对良好的改进。

Dec, 2015

基于区域的语义分割与端到端训练

本文提出一种新的语义分割方法，该方法基于区域分类方法和全卷积方法相结合，能够实现端到端的培训。与目前现有的算法相比，该方法在语义分类的平均准确性方面提高了成绩，在 SIFT Flow 和 PASCAL Context 上达到了 64.0% 和 49.9% 的成绩，并且在物体边界方面特别准确。

Jul, 2016

Actor-Critic 实例分割

该研究使用强化学习中的演员 - 评论家方法，在实例分割基准测试中始终提供准确度优势，以解决在场景中分割多个潜在相似且部分遮挡的对象的挑战性问题

Apr, 2019

基于语音查询的视频角色空间 - 时间协同建模分割

本文提出了一种基于协作的时空编码器 - 解码器框架，其中包含一个三维时间编码器和一个二维空间编码器。在解码器中，提出了一种语言引导的特征选择模块和一种交叉模态适应调制模块，以动态重新组合语言特征和时空相关特征。与以往的方法相比，我们的方法在两个流行的基准测试中实现了新的最先进性能，并且计算开销更小。

May, 2021

基于演员条件的视频行动检测的注意力地图

本研究提出使用注意力模块中的演员条件化关注映射（ACAM）代替兴趣区域池化，以实现针对特定演员的动作定位，并利用预训练的物体检测器进行物体检测，从而在 AV2.1 和 JHMDB 数据集上获得明显改进。

Dec, 2018

视频动作检测端到端半监督学习

提出一种利用半监督学习方法，结合已标注和未标注数据对视频行为检测进行改进的方法，其中使用分类一致性和时空一致性约束，提出了两个新的正则化约束条件，即时间相关性和梯度平滑性，以处理视频中存在的背景和固定区域，进而实现更好的检测效果。在 UCF101-24 数据集上，仅仅使用已标注数据的 20％，该方法就比最近的完全监督式方法提高了 8.9％和 11％，且在 Youtube-VOS 上的视频对象分割上也表现出了很好的泛化能力。

Mar, 2022

基于帧间聚合的网络视频主体区域弱监督语义分割

本研究利用网络上自动采集的视频，通过使用时域信息可以识别目标对象的更大区域，从而产生与标记相似的结果，该方法在验证集上超过了现有标准，并使结果达到了最新的水平。

Aug, 2019

使用语义身体部位行为的单张图像动作识别

本篇论文提出一种基于语义身体部位行为的新型单张图片行为识别算法，通过给人体的五个部位（头部，躯干，臂部，手和腿）定义不同语义的部位行动来识别人体动作，并且通过串联局部行动预测出整个身体的行动，最终在 PASCAL VOC 2012 和 Stanford-40 两个数据集上，相比 State-of-the-art 的准确率分别提高了 3.8% 和 2.6%。

Dec, 2016