BriefGPT.xyz
Feb, 2021
神经形态变化中的搜索错误探寻
Searching for Search Errors in Neural Morphological Inflection
HTML
PDF
Martina Forster, Clara Meister, Ryan Cotterell
TL;DR
该研究探讨了神经序列到序列模型在语言生成任务中的应用,发现在单词级任务中,准确推断这些模型会发现空字符串常常是全局最优解,但在形态学变化的情况下,空字符串几乎不是模型最可能的解,且贪婪搜索通常能找到全局最优解。这表明,许多神经模型的不良校准可能来自于特定任务的特征,而非这些模型在语言生成方面的普遍不适用性。
Abstract
neural sequence-to-sequence models
are currently the predominant choice for
language generation
tasks. Yet, on word-level tasks,
exact inference<
→