利用 ProbSom 识别阿根廷手语的手势形状
自动手语识别是一个研究领域,包括人机交互、计算机视觉和机器学习。该论文介绍了一个涉及阿根廷手语的数据集,名为 LSA64,旨在构建一个针对阿根廷手语识别或其他机器学习任务的全面研究级数据集的第一步。
Oct, 2023
该研究探讨了自动手语识别的问题,提出了一种基于概率模型的手语分类方法,通过对具有 64 个类别和 3200 个样本的阿根廷手语数据集进行测试,证实了可以实现不考虑顺序的识别,并取得了 97% 的准确率。
Oct, 2023
本文介绍了 OpenHands 库,将 NLP 中四个关键点应用于手语识别中,包括姿势提取,训练基于姿势的孤立手语识别模型,自我监督预训练和跨语言迁移,并在 6 种不同的手语中标准化姿势数据集和预训练数据集。
Oct, 2021
为解决手语识别方法中低准确率和鲁棒性差的问题,该研究提出了一种整合手部骨架特征和面部表情的手语识别网络,通过坐标转换提取更准确的手部形状特征,并结合面部表情信息,最终提高了手语识别的准确性和鲁棒性。这一方法在阿根廷手语数据库和东南大学中国手语识别数据库上得到了验证。
Jul, 2024
通过提取身体、手部和面部关键点并将其编码为 2D 图像,本研究提出了一种孤立手语识别(ISLR)方法,通过卷积神经网络映射视觉和时间信息到手语标签,实验证明该方法在两个广为认可的巴西手语(LIBRAS)数据集上的性能指标超过了现有技术。此外,由于依赖于更简单的网络架构和仅使用 RGB 数据作为输入,本方法更准确、更高效且更易于训练。
Apr, 2024
该论文提出了一种自然语言辅助手语识别 (NLA-SLR) 框架,利用手语词汇中的语义信息来降低手语识别中存在的视觉相似性 (VISigns) 问题。该论文设计了语言辅助标签平滑和交互式混合等技术来提高识别性能,并引入了视频关键点网络作为新型的骨干网络来获得更好的结果。实验结果表明,该方法在三个广泛采用的基准测试数据集上均达到了最先进的性能。
Mar, 2023
该研究旨在利用计算机视觉技术和卷积神经网络,开发一种实时、基于印度手语的手语识别系统,以帮助印度的聋人和听力有障碍的人群。经过多次处理和训练,该模型的准确率达到了 99%。
Apr, 2023