TS-RGBD 数据集：面向视觉障碍人士的剧场场景描述的新型数据集

Aug, 2023

TS-RGBD 数据集：面向视觉障碍人士的剧场场景描述的新型数据集

TS-RGBD Dataset: a Novel Dataset for Theatre Scenes Description for People with Visual Impairments

Leyla Benhamida, Khadidja Delloul, Slimane Larabi

TL;DR在这篇论文中，我们提出了一个包含具有人类动作的真实场景和密集标题注释的新型 RGB-D 数据集（TS-RGBD 数据集），以进行影像字幕和人类动作识别。我们测试了图像字幕模型和基于骨骼的人类动作识别模型，以通过检测人类动作并对剧场场景中感兴趣区域的外观进行文本描述，拓展了视障人士所在环境类型的范围。

Abstract

computer vision was long a tool used for aiding visually impaired people to move around their environment and avoid obstacles and falls. Solutions are limited to either indoor or outdoor scenes, which limits the

computer vision visually impaired rgb-d dataset theatre scenes human action recognition

发现论文，激发创造

面向盲人和视障人士的实时自我的运动段落字幕生成在 RGB-D 影院图像中的研究

通过图像字幕和分割，本研究提出了一种帮助盲人和视觉受损人士了解和重建环境的方法，该方法提供了与他们相关的区域和对象的位置描述（左、右、前），以及区域之间的位置关系，通过将解决方案应用于 TS-RGBD 数据集，旨在帮助他们访问戏剧表演。

Aug, 2023

NTU RGB+D：一个用于 3D 人类活动分析的大规模数据集

本文介绍了一个包含超过 56,000 个视频样本和 4 百万帧的大规模 RGB + D 人体动作识别数据集，其中包括 60 种不同的行为类别，并提出了一种新的循环神经网络结构来更好地对每个身体部位的特征进行长期时间相关性建模。实验结果表明，在跨主体和跨视图评估标准上，应用深度学习方法比最先进的手工制作特征具有优势。

Apr, 2016

基于 RGB-D 的动作识别数据集：调查

本文系统回顾了人类动作识别中使用的 RGB-D 数据集，包括单视图、多视图和多人数据集，并分析了这些数据集的详细信息。此外，还讨论了当前算法评估中存在的问题，提出了收集新数据集和使用评估协议的建议。

Jan, 2016

NTU RGB+D 120：一个用于 3D 人体活动理解的大规模基准测试数据集

本论文介绍了一个大规模数据集，用于 RGB+D 人体动作识别。研究显示，应用深度学习技术的 3D 人体动作识别方法更加优越，并提出了新的 APSR 解决方案，可以有效地识别新的动作类型。

May, 2019

RGBD 数据集：过去、现在和未来

本文探讨了与 RGBD 数据集有关的八个类别，并提出了一些关于其未来的方向，这有助于研究人员找到适合他们需求的数据，并考虑哪些数据集在推动计算机视觉方向上取得了成功和原因。

Apr, 2016

面向任意视角人体动作识别的大规模多视角 RGB-D 动作数据集

本文介绍了一个新的大规模 RGB-D 数据集，其中包括固定视角和全方位视角下的 40 种行动，以及 VS-CNN 模型的提出和有效性验证，该模型可用于解决任意视角下行动识别的问题。

Apr, 2019

用于开发和基准测试主动视觉的数据集

该论文使用真实影像，聚焦日常室内环境下机器人视觉任务的模拟，构建新的公共数据集。该数据集可用于机器人视觉任务中的物体检测、主动视觉模拟和基于深度学习的强化学习下的下一步动作预测。在使用数据集的过程中，作者发现现有物体检测研究最大的问题是机器人视角对物体尺度，遮挡和方向的影响。

Feb, 2017

ARKitScenes: 使用移动 RGB-D 数据的 3D 室内场景理解多样化真实世界数据集

介绍了 ARKitScenes，这是第一个使用 RGB-D 数据集且具有广泛可用深度传感器的室内场景认知数据集，并分析了数据集的有用性，包括用于 3D 对象检测和颜色引导深度上采样。

Nov, 2021

RGBD1K: 一种用于 RGB-D 物体跟踪的大规模数据集和基准

本研究关注的是 RGB-D 物体跟踪，并通过发布新的 RGBD1K 数据集和利用此数据集中的 transformer-based RGB-D 跟踪器 (SPT) 作为我们的基线来展示其训练的益处和可潜力以提高 RGB-D 跟踪的性能。

Aug, 2022

学习有效的 RGB-D 场景识别表示

该研究介绍一种基于深度学习的 RGB-D 场景识别方法，提出了一种深度学习模型训练的两步骤方法和一种新的 RGB-D 视频数据集，实现了在 RGB-D 图像 (NYUD2 和 SUN RGB-D) 和视频 (ISIA RGB-D) 场景识别方面的最优表现。

Sep, 2018