Jun, 2024

重新考虑句子级手语翻译

TL;DR历史上,手语机器翻译一直被认为是一个基于句子级任务的:数据集由连续的叙述切割并作为孤立的片段呈现给模型。在这项工作中,我们探索了这一任务框架的局限性。首先,我们调查了一些手语中依赖于话语级上下文的语言现象。然后,作为一个研究案例,我们进行了手语翻译的第一个人类基准,实际上是将人类置于机器学习任务框架中,而不是将整个文档作为上下文提供给人类。这个人类基准 —— 针对 How2Sign 数据集的 ASL 到英语翻译 —— 显示,在我们的样本中,对于 33% 的句子,我们流利的聋人手语翻译员只能在附加的话语级上下文中理解片段的关键部分。这些结果强调了在将机器学习应用于新领域时理解和检查示例的重要性。