Actor-Critic 实例分割

CVPRApr, 2019

Actor-Critic Instance Segmentation

Nikita Araslanov, Constantin Rothkopf, Stefan Roth

TL;DR该研究使用强化学习中的演员 - 评论家方法，在实例分割基准测试中始终提供准确度优势，以解决在场景中分割多个潜在相似且部分遮挡的对象的挑战性问题

Abstract

Most approaches to visual scene analysis have emphasised parallel processing of the image elements. However, one area in which the sequential nature of vision is apparent, is that of segmenting multiple, potentially similar and partially occluded objects in a scene. In this work, we re

visual scene analysis sequential vision segmentation reinforcement learning actor-critic model

发现论文，激发创造

区域掩模的演员 - 动作语义分割

本文提出了一种基于区域的演员 - 动作语义分割方法，通过实例分割算法的区域掩模，避免对掩模内的像素进行独立标记，达到了一致的动作标记并在 A2D 数据集上得到了显著的性能提升。

Jul, 2018

基于递归注意力的端到端实例分割

本研究提出了一种基于循环神经网络加注意机制的端到端模型，可以进行场景中物品实例的细节分割，并在 CVPPP、KITTI 和 Cityscapes 数据集上获得了竞争性的结果。

May, 2016

图形对象中心的演员 - 评论家算法

最近在无监督的物体中心表示学习问题和其在下游任务中的应用方面取得了重大进展。最新研究支持这样一个论点：在基于图像的物体中心强化学习任务中使用解耦的物体表示有助于策略学习。我们提出了一种新颖的物体中心强化学习算法，结合了演员 - 评论家和基于模型的方法，有效地利用这些表示。我们的方法使用转换编码器提取物体表示，并使用图神经网络来近似环境动力学。所提出的方法填补了开发用于离散或连续动作空间环境的高效物体中心世界模型的研究空白。与基于转换器架构的最先进的无模型演员 - 评论家算法和最先进的整合模型为基础的算法相比，我们的算法在视觉复杂的三维机器人环境和具有组合结构的二维环境中表现更好。

Oct, 2023

序列型演员 - 评论家算法在图像字幕生成中的应用

本研究探究了基于 actor-critic 强化学习的图像标题生成模型的训练方法，通过计算每个 token 的优势和值实现直接优化语言质量指标，取得了在 MSCOCO 数据集上的最先进性能。

Jun, 2017

分布式实例分割：用潜在的 MaskRCNN 模型建模不确定性和高置信度预测

本文提出一种基于概率分布的实例分割方法，利用潜在编码来建模物体掩膜的可能假设，从而降低机器人应用中的临界错误率。在实际服装拣选机器人上，该方法成功降低了错误率并提高了性能。

May, 2023

循环实例分割

该研究提出了一种基于循环神经网络的端到端方法，通过顺序地查找每个不同的目标对象及其分割来解决实例分割的问题，并通过空间记忆来跟踪已解释的像素，以处理遮挡，这种方法优于当前所有最先进的方法。

Nov, 2015

MaskRNN：实例级视频对象分割

本文提出了一种名为 MaskRNN 的递归神经网络方法，它在每帧中利用两个深度成像网络输出（二元分割网络和定位网络）进行目标实例的视频对象分割以获取长时序结构和剔除异常值，结果在 DAVIS-2016、DAVIS-2017 和 Segtrack v2 数据集中均达到了最优表现。

Mar, 2018

多智能体强化学习的演员 - 注意力 - 评论家模型

提出了一个基于 Actor-Critic 算法的多智能体强化学习算法，解决了多智能体场景下的信息筛选问题，可应用于大多数多智能体学习问题。

Oct, 2018

视频对象分割的学习实例传播（Learning Instance Propagation for Video Object Segmentation）

本研究提出了一种端到端的深度神经网络，结合了 Mask-RCNN 实例分割网络和 Conv-GRU 视觉记忆模块，用于解决半监督视频对象分割任务，实验结果表明该方法在 DAVIS 数据集上取得了令人满意的结果。

Sep, 2019

从句子中分离演员和动作的视频分割

该研究旨在实现对视频内容中演员和他们的动作进行像素级别的分割。通过自然语言输入句子推断分割，以实现在同一超级类别中对精细的演员进行区分，并识别演员和动作实例，以及分割超出演员和动作词汇的成对内容。提出了一种用于视频像素级别的演员和动作分割的全卷积模型，采用编码器 - 解码器结构进行优化。扩展了两个流行的演员和动作数据集，并添加了超过 7,500 个自然语言描述，展示了基于句子的分割的潜力、我们模型的泛化能力和其与现有技术相比在传统演员和动作分割方面的优势。

Mar, 2018