ACLOct, 2022

利用领域文本生成对回译进行缩放,用于手语术语翻译

TL;DR本文提出了一种 Prompt-based domain text generation (PGEN) 方法来克服标记稀缺性问题,该方法使用预训练语言模型(即 GPT-2)生成类似于原始领域口语的文本,通过该方法生成的口语文本用于 BT 技术,实现了手语标记翻译方面的显着性能提升,并且 PGEN 生成的口语文本规模越大,BT 技术的效果越好。