Nov, 2017

深度学习任务中词嵌入初始化的探索

TL;DR本研究探讨了深度学习中用于嵌入的各种随机和预先训练的初始化方法对四个自然语言处理任务性能的影响,结果表明预先训练的嵌入略优于随机初始化,但只要方差保持合理,各种随机初始化方法并没有显著差异,并发现高方差初始化会阻止网络使用嵌入空间而强制其使用其他自由参数来完成任务。