May, 2023

再探类指针网络架构以有效改善下一个单词的分布,摘要真实性及其他方面

TL;DR本研究发现传统的语言模型中的Softmax层有瓶颈,使用Pointer Networks可以更高效地预测下一个单词的概率分布,并提出了多种简化Pointer Networks的方法,实验表明在GPT-2中应用这些方法可以显著提升摘要生成性能。