Jul, 2023

NL-to-Bash 语义解析器中的结构迁移学习

TL;DR大规模预训练在许多自然语言处理领域取得了进展,但对于预训练数据集的设计了解甚少。我们提出了一种获取机器翻译任务之间结构重叠的定量理解的方法。我们将该方法应用于自然语言到 Bash 语义解析任务 (NLBash),并表明它在很大程度上可以归结为词汇对齐。我们还发现 NLBash 与自然语言到 SQL 之间存在很强的结构重叠。此外,我们在英语到德语机器翻译任务中进行了一项研究,研究了预训练期间的计算资源使用情况,并发现预训练期间使用更多计算资源并不总是与语义表示中更强的 NLBash 传递对应。