BriefGPT.xyz
Ask
alpha
关键词
anisotropy dynamics
搜索结果 - 1
ACL
学习的形态:基于 Transformer 模型的各向异性和固有维度
我们研究了 Transformer 结构中编码器和解码器之间的各向异性动态和内部维度,并发现解码器中的各向异性特征呈现出一个具有峰型曲线的独特模式,峰值位于中间层,与编码器中更均匀分布的各向异性特征不同。此外,我们发现嵌入的内部维度在训练的
→
PDF
8 months ago
Prev
Next