BriefGPT.xyz
Ask
alpha
关键词
abstract structural information
搜索结果 - 1
ACL
语言模型中的结构稳定性:启动作为窥视抽象语言表征的窗口
研究现代神经语言模型在结构启动方面的易感性,探讨如何利用启动来研究这些模型学习抽象结构信息的潜力,引入新度量和发布大型语料库 Prime-LM,发现 Transformer 模型确实显示结构启动的证据,但也显示出它们学习的概括在某种程度上受
→
PDF
3 years ago
Prev
Next