手语产生过程评论
本篇文章使用深度学习综述了手语生产及相关领域的最新进展,包括手语翻译系统、聋文化、心理学视角、口语和手语之间的主要区别、SLP 的主要挑战和评估方法,并讨论了未来的研究方向和可能的发展。
Jan, 2022
本篇论文呼吁自然语言处理 (NLP) 社群将手语作为高社会和科学影响力的研究领域之一,评估了手语的语言学特征,并探讨了如何扩展 NLP 到手语,并建议采用有效的标记方法、开发基于语言学的模型、收集真实世界的手语数据、将当地的手语社区作为研究方向的积极和领导性声音。
May, 2021
该论文介绍了一种利用向量量化从手语姿势序列中得出离散表示的手语矢量量化网络的新方法,该方法支持高级解码方法,并整合了潜在级别的对齐以增强语言的一致性,并通过综合评估证明了该方法优于之前的手语生产方法的卓越性能,并突出了反向转译和 Fréchet 手势距离作为评估指标的可靠性
Sep, 2023
开发一种基于人工智能的成本效益高、资源高效和开放的技术,旨在帮助人们学习和使用手语进行交流,以促进社会的包容性。该研究分析了基于人工智能的手语解决方案,特别聚焦美国手语,取得了令人满意的初步结果,并为进一步发展奠定了基础。
Feb, 2024
将连续动作生成问题转化为离散序列生成问题的创新解决方案,利用矢量量化方法以及转换器,将口语文本翻译为动作序列,并通过签名拼接方法有效地组合标记,实验证明该方法胜过以往方法,使 BLEU-1 回译得分提高了 72%。
Apr, 2024
本文提出了利用对抗多通道模型进行手语翻译的方法,在模仿人类手语制作过程中加入非手势要素,如面部特征和口型模式,以提高语言翻译的准确度。我们采用基于转换器的生成器和条件判别器的最小化极值过程,根据来源文本制作符合实际的手语,并在 RWTH-PHOENIX-Weather-2014T (PHOENIX14T) 数据集上进行了评估和表现改进。
Aug, 2020
该研究旨在利用计算机视觉技术和卷积神经网络,开发一种实时、基于印度手语的手语识别系统,以帮助印度的聋人和听力有障碍的人群。经过多次处理和训练,该模型的准确率达到了 99%。
Apr, 2023
该研究论文介绍了一个基于深度学习的大规模美国手语(ASL)生成预训练模型,以解决对 ASL 依赖的残障人士之间的沟通障碍,并提出了用于 ASL 生成的基于条件扩散的预训练模型,同时改进了模型的准确性和质量,以及图像指标的优化。
Aug, 2023