Feb, 2021

神经形态变化中的搜索错误探寻

TL;DR该研究探讨了神经序列到序列模型在语言生成任务中的应用,发现在单词级任务中,准确推断这些模型会发现空字符串常常是全局最优解,但在形态学变化的情况下,空字符串几乎不是模型最可能的解,且贪婪搜索通常能找到全局最优解。这表明,许多神经模型的不良校准可能来自于特定任务的特征,而非这些模型在语言生成方面的普遍不适用性。