Jan, 2024

口语到手语翻译的简单基准模型与 3D 人偶

TL;DR本文旨在开发一种功能性系统,实现将口语翻译成手语的功能,称之为 Spoken2Sign 翻译。我们提出了一个简单的基线,由三个步骤组成:使用现有的 Sign2Spoken 基准创建一个手语视频字典;为字典中的每个手语视频估计一个 3D 手语;借助产生的手语 - 3D 手语字典,训练一个由 Text2Gloss 翻译器、手语连接器和渲染模块组成的 Spoken2Sign 模型。我们是首次将 Spoken2Sign 任务呈现为 3D 手语输出格式,除了能进行 Spoken2Sign 翻译外,我们还证明了我们方法的两个附带产品 ——3D 关键点增强和多视图理解对基于关键点的手语理解的辅助作用。