手语产生过程评论

Mar, 2021

Sign Language Production: A Review

Razieh Rastgoo, Kourosh Kiani, Sergio Escalera, Mohammad Sabokrou

TL;DR本研究综述了深度学习在手语制作和相关领域上的最新进展以及所面临的挑战、优势、限制和未来研究方向。

Abstract

sign language is the dominant yet non-primary form of communication language used in the deaf and hearing-impaired community. To make an easy and mutual →

sign language communication translation deep learning slp

发现论文，激发创造

手语制作所需一切

本篇文章使用深度学习综述了手语生产及相关领域的最新进展，包括手语翻译系统、聋文化、心理学视角、口语和手语之间的主要区别、SLP 的主要挑战和评估方法，并讨论了未来的研究方向和可能的发展。

Jan, 2022

手语识别技术和算法的比较分析

该研究比较了各种深度学习技术对手语的识别，旨在提供这一领域中最新方法和挑战的综合概述。

May, 2023

自然语言处理中包含手语

本篇论文呼吁自然语言处理 (NLP) 社群将手语作为高社会和科学影响力的研究领域之一，评估了手语的语言学特征，并探讨了如何扩展 NLP 到手语，并建议采用有效的标记方法、开发基于语言学的模型、收集真实世界的手语数据、将当地的手语社区作为研究方向的积极和领导性声音。

May, 2021

自回归手语制作：基于离散表示的无词汇化方法

该论文介绍了一种利用向量量化从手语姿势序列中得出离散表示的手语矢量量化网络的新方法，该方法支持高级解码方法，并整合了潜在级别的对齐以增强语言的一致性，并通过综合评估证明了该方法优于之前的手语生产方法的卓越性能，并突出了反向转译和 Fréchet 手势距离作为评估指标的可靠性

Sep, 2023

一个实时的人工智能学习手语的系统

开发一种基于人工智能的成本效益高、资源高效和开放的技术，旨在帮助人们学习和使用手语进行交流，以促进社会的包容性。该研究分析了基于人工智能的手语解决方案，特别聚焦美国手语，取得了令人满意的初步结果，并为进一步发展奠定了基础。

Feb, 2024

使用隐藏动态变换器进行手语产生

经过改进，我们开发了一种新方法来制作高质量的手语视频，不需要使用人类姿势作为中间步骤。与之前的方法相比，我们的模型在两个手语数据集上表现更好。

Dec, 2023

基于数据驱动的手语表达方式

将连续动作生成问题转化为离散序列生成问题的创新解决方案，利用矢量量化方法以及转换器，将口语文本翻译为动作序列，并通过签名拼接方法有效地组合标记，实验证明该方法胜过以往方法，使 BLEU-1 回译得分提高了 72%。

Apr, 2024

多通道手语生成对抗训练

本文提出了利用对抗多通道模型进行手语翻译的方法，在模仿人类手语制作过程中加入非手势要素，如面部特征和口型模式，以提高语言翻译的准确度。我们采用基于转换器的生成器和条件判别器的最小化极值过程，根据来源文本制作符合实际的手语，并在 RWTH-PHOENIX-Weather-2014T (PHOENIX14T) 数据集上进行了评估和表现改进。

Aug, 2020

基于图像的印度手语识别：使用深度神经网络的实用综述

该研究旨在利用计算机视觉技术和卷积神经网络，开发一种实时、基于印度手语的手语识别系统，以帮助印度的聋人和听力有障碍的人群。经过多次处理和训练，该模型的准确率达到了 99%。

Apr, 2023

SignDiff: 学习美国手语表达的扩散模型

该研究论文介绍了一个基于深度学习的大规模美国手语（ASL）生成预训练模型，以解决对 ASL 依赖的残障人士之间的沟通障碍，并提出了用于 ASL 生成的基于条件扩散的预训练模型，同时改进了模型的准确性和质量，以及图像指标的优化。

Aug, 2023