手语识别技术和算法的比较分析
该研究旨在利用计算机视觉技术和卷积神经网络,开发一种实时、基于印度手语的手语识别系统,以帮助印度的聋人和听力有障碍的人群。经过多次处理和训练,该模型的准确率达到了 99%。
Apr, 2023
开发一种基于人工智能的成本效益高、资源高效和开放的技术,旨在帮助人们学习和使用手语进行交流,以促进社会的包容性。该研究分析了基于人工智能的手语解决方案,特别聚焦美国手语,取得了令人满意的初步结果,并为进一步发展奠定了基础。
Feb, 2024
连续手语识别 (CSLR) 着重于对连续进行而没有停顿的手语姿势序列的解释。本研究对最新的深度学习 CSLR 技术进行了实证评估,并评估其在各种数据集和手语中的表现。所选择的模型实施了一系列用于提取有意义特征的方法,并采用不同的训练策略。通过在多个数据集上评估这些模型,特别是 RWTH-PHOENIX-Weather-2014、ArabSign 和 GrSL,分别代表着不同的手语,来确定它们对建模不同手语的功效。所进行的实验在所选择的数据集上建立了新的基准,并为在具有挑战性场景下评估的技术的稳健性和泛化性提供了有价值的见解。
Jun, 2024
通过使用卷积神经网络和 LSTM 模型进行手势和静态手语识别,研究开发了一种印度手语转换为文本或语音的文本 - 手语翻译模型,可以帮助聋人和听障人士在社交、教育和职业场境中进行更准确的交流。
Apr, 2023
电脑识别视频中孤立符号存在着一些困难,其中包括手语者之间的口头和非口头的同步变化以及特定符号的实现中存在的社会语言学变化。本文概述了这些挑战,并基于大规模的语言学注释视频数据的发现,对美国手语的符号结构中的某些规律进行了讨论。
Nov, 2023
该论文提出了一种自然语言辅助手语识别 (NLA-SLR) 框架,利用手语词汇中的语义信息来降低手语识别中存在的视觉相似性 (VISigns) 问题。该论文设计了语言辅助标签平滑和交互式混合等技术来提高识别性能,并引入了视频关键点网络作为新型的骨干网络来获得更好的结果。实验结果表明,该方法在三个广泛采用的基准测试数据集上均达到了最先进的性能。
Mar, 2023
该研究使用轻量级神经网络模型和 Bert-Base-Chinese 模型开发了一种适用于中文手语的实时翻译系统,经过性能测试表明其识别准确率达到了 99.3%,翻译生成的时间大约为 1.3 秒。
Jun, 2023
使用机器学习通过识别手势翻译手语对听障人群和其他人之间的交流有重要意义,该研究使用网络摄像头进行印度手语数据集构建,使用迁移学习训练 TensorFlow 模型实现实时手语识别系统,并实现了较高的准确率。
Jan, 2022
本文介绍了一个基于可穿戴设备的自动手语识别系统的概念验证,该系统通过采集动态手语的数据序列并使用机器学习方法来解释一组美国手语(ASL)动态单词。建立的模型达到了高质量的性能,如随机森林模型准确率达到了 99%,支持向量机(SVM)和两个 K 最近邻(KNN)模型准确率均为 98%,这表明了一个全面系统发展的许多可能路径。
Dec, 2023