一个实时的人工智能学习手语的系统
通过从演示中学习,我们研究了通过获取非语言交流技能,特别是手语理解和表达方面的潜在应用,我们专注于对人工智能代理进行模仿学习,使用计算机视觉和深度学习从视频中提取信息,并使用强化学习使代理能够复制观察到的动作,这种方法消除了需要额外硬件的需求,我们成功地教授了涉及上半身(即臂和手)的 5 种不同的手势,为人工智能代理的高级沟通技能铺平了道路。
Jun, 2024
对手语人工智能领域的 101 篇近期研究论文进行了系统审查,发现该领域存在系统性偏见,缺乏代表性数据集,使用缺乏语言基础的注释以及构建在有缺陷模型上的方法,最终得出结论:该领域需要开放空间,让聋人研究者引领手语人工智能的讨论。
Mar, 2024
本文介绍了一个基于可穿戴设备的自动手语识别系统的概念验证,该系统通过采集动态手语的数据序列并使用机器学习方法来解释一组美国手语(ASL)动态单词。建立的模型达到了高质量的性能,如随机森林模型准确率达到了 99%,支持向量机(SVM)和两个 K 最近邻(KNN)模型准确率均为 98%,这表明了一个全面系统发展的许多可能路径。
Dec, 2023
该研究旨在利用计算机视觉技术和卷积神经网络,开发一种实时、基于印度手语的手语识别系统,以帮助印度的聋人和听力有障碍的人群。经过多次处理和训练,该模型的准确率达到了 99%。
Apr, 2023
使用机器学习通过识别手势翻译手语对听障人群和其他人之间的交流有重要意义,该研究使用网络摄像头进行印度手语数据集构建,使用迁移学习训练 TensorFlow 模型实现实时手语识别系统,并实现了较高的准确率。
Jan, 2022
该研究使用轻量级神经网络模型和 Bert-Base-Chinese 模型开发了一种适用于中文手语的实时翻译系统,经过性能测试表明其识别准确率达到了 99.3%,翻译生成的时间大约为 1.3 秒。
Jun, 2023
通过使用卷积神经网络和 LSTM 模型进行手势和静态手语识别,研究开发了一种印度手语转换为文本或语音的文本 - 手语翻译模型,可以帮助聋人和听障人士在社交、教育和职业场境中进行更准确的交流。
Apr, 2023
本篇论文呼吁自然语言处理 (NLP) 社群将手语作为高社会和科学影响力的研究领域之一,评估了手语的语言学特征,并探讨了如何扩展 NLP 到手语,并建议采用有效的标记方法、开发基于语言学的模型、收集真实世界的手语数据、将当地的手语社区作为研究方向的积极和领导性声音。
May, 2021