ADDSL：在丹麦手语标注数据上的手势检测与手语识别

May, 2023

ADDSL：在丹麦手语标注数据上的手势检测与手语识别

ADDSL: Hand Gesture Detection and Sign Language Recognition on Annotated Danish Sign Language

Sanyam Jain

TL;DR本文介绍了一个新的数据集，ADDSL，用于手势识别和识别手势字母或数字，使用此数据集训练的基于 YOLOv5 的目标检测器模型具有 92% 的准确率，比现有工作更有效和准确。

Abstract

For a long time, detecting hand gestures and recognizing them as letters or numbers has been a challenging task. This creates communication barriers for individuals with disabilities. This paper introduces a new dataset, the Annotated Dataset for danish sign language (ADDSL). Annota-ti

danish sign language hand gesture recognition object detection yolov5 disability

发现论文，激发创造

MS-ASL：用于理解美国手语的大规模数据集和基准

本文提出了一个包括 25,000 个有注释视频的美国手语数据集，通过 I3D 架构的应用，实现了对 1000 个手势的无限制语境下的识别。

Dec, 2018

基于 YOLOv5 算法的泰卢固手语识别

通过使用 YOLOv5 对象识别框架，本研究提出了一种新颖的方法来识别 TSL 手势，为聋哑社区提供准确和成功的手势识别方法。利用迁移学习方法，将 YOLOv5 模型定制为 TSL 手势，经过调参和优化，获得了 90.5% 的 F1 值和 98.1% 的 mAP 值。该研究为可访问技术的未来发展奠定了基础，并提供了对 TSL 手势识别领域的深入洞察和新颖方法。

Apr, 2024

连接节点：利用时空图神经网络进行准确的孟加拉手语识别

本研究提供了一个新的词级孟加拉手语数据集（BdSL40），包含 611 个单词的 40 个视频，以及两种不同的方法：一种是基于 3D 卷积神经网络模型，另一种是基于图神经网络的方法，用于对 BdSL40 数据集进行分类。该研究还揭示了 BdSL、西孟加拉手语和印度手语之间的显著词汇和语义相似性，以及文献中对 BdSL 缺乏词级数据集的情况。我们发布了数据集和源代码以促进进一步的研究。

Jan, 2024

AUTSL：一个大规模的多模态土耳其手语数据集和基准方法

本文介绍了一种新的大规模多模式土耳其手语数据集 (AUTSL)，为性能评估提供了基准模型；使用卷积神经网络提取特征、使用单向和双向 LSTM 模型表征时间信息，以及结合特征池化模块和时间注意力来提高模型性能。在 AUTSL 随机训练和测试集上，模型的表现达到了 95.95% 的准确度，并在提出的用户独立基准数据集上取得了 62.02% 的最佳基线模型效果。

Aug, 2020

使用神经形态硬件进行美式手语的静态手势识别

该论文研究使用 4 种脉冲神经网络模型对美国手语静态手势进行分类，分别使用 ASL 字母和 ASL 数字的数据集进行相关实验，使用英特尔神经形态平台 Loihi 进行比较。结果表明，相较于英特尔神经计算棒 2，Loihi 实现方式在精度、延迟、功耗和能耗方面均优于英特尔神经计算棒 2。

Jul, 2022

基于深度学习的手语识别方法综述

通过实验评估了基于计算机视觉的手语识别方法，并引入了新的序列训练标准，讨论了许多预训练方案，并创建了带注释的希腊手语 RGB + D 数据集。

Jul, 2020

LSA64: 阿根廷手语数据集

自动手语识别是一个研究领域，包括人机交互、计算机视觉和机器学习。该论文介绍了一个涉及阿根廷手语的数据集，名为 LSA64，旨在构建一个针对阿根廷手语识别或其他机器学习任务的全面研究级数据集的第一步。

Oct, 2023

BdSLW60: 一个词汇级别的孟加拉手语数据集

本文介绍了一种新的方法，基于一个全面的 Bangla 手势词级数据集（BdSLW60），通过在不受约束的自然环境中捕捉手势的动态特性，允许位置和时间上的变化，并允许手势使用者自由更改手势的手的主导性，进而实现手势识别任务。

Feb, 2024

视频中基于单词的深度手语识别：一个新的大规模数据集和方法比较

本文介绍了一个新的大规模美国手语单词语义（WLASL）数据集，并实现了基于外观和人体姿态的 2 个模型，以及提出了一种新的基于姿态的时态图卷积网络（Pose-TGCN）方法，同时模拟人体姿态轨迹中的空间和时间依赖关系，为手语识别研究提供了一个有价值的基准实验平台。

Oct, 2019

AdaBrowse: 自适应视频浏览器以提高连续手语识别效率

提出了一种新的自适应模型（AdaBrowse），通过将连续手语识别（CSLR）问题建模成顺序决策任务，动态选择输入视频序列中最具信息量的子序列，并利用时空冗余实现高效计算，对四个大规模 CSLR 数据集进行了广泛的实验，证明了 AdaBrowse 的有效性。

Aug, 2023