关键词feed-forward layers
搜索结果 - 4
  • ACL研究神经元激活作为统一视角来解释 LLM 的引发思维链的算术推理
    PDF16 days ago
  • 变压器激活空间分析中的可解释性:重点调查
    PDFa year ago
  • EMNLPTransformer 前馈层即键值内存
    PDF4 years ago
  • 机器翻译加权变形器网络
    PDF7 years ago
Prev
Next