BriefGPT.xyz
Ask
alpha
关键词
structural grokking
搜索结果 - 1
ACL
香草 Transformer 中的分层结构理解
本文研究了神经序列和转换语言模型的层次结构泛化能力,发现通过长时间训练,模型能够学习到层次结构的一般性,对模型深度的分析证明浅层和深层不如中等深度的模型性能优秀。此发现证实了香草珂朵莉模型能够发现和使用自然语言中的层次结构。
PDF
a year ago
Prev
Next