关键词attention heads
搜索结果 - 44
  • ICML视觉 Transformer 中的多样特征学习以提高泛化性能
    PDF10 months ago
  • 电路分析可解释性是否具有可扩展性?来自琪尼兔的多项选择能力的证据
    PDFa year ago
  • 发现具有期望特性的变量绑定电路
    PDFa year ago
  • GATology 在语言学中的应用:它能识别哪些句法依存关系
    PDFa year ago
  • ACLHiFi: 高信息注意力头用于参数有效的模型调整
    PDFa year ago
  • Logion:希腊语学领域机器学习
    PDFa year ago
  • 自回归语言模型中事实关联的回忆解剖
    PDFa year ago
  • EMNLP在保留通用知识的同时调整语言模型
    PDFa year ago
  • 自然语言生成模型中的间接对象识别电路实现及其解释性
    PDF2 years ago
  • XAI for Transformers: 通过保守传递实现更好的解释
    PDF2 years ago
  • EMNLP干细胞假说:利用 Transformer 编码器进行多任务学习面临的困境
    PDF3 years ago
  • ACLTransformer 注意力头在多语言和跨语言任务中的贡献
    PDF3 years ago
  • CVPR三流网络用于增强动作识别
    PDF3 years ago
  • AAAIHeads 假设:一种统一的统计方法,用于理解 BERT 中的多头注意力
    PDF3 years ago
  • 单次元元剪枝:减少注意力头部无关部分
    PDF4 years ago
  • COLING缓解神经机器翻译中注意力头不平等
    PDF4 years ago
  • 关于 Transformer 的计算能力及其对序列建模的启示
    PDF4 years ago
  • 通过相对位置对知识图谱进行文本生成的图结构建模
    PDF4 years ago
  • ECCV幕后揭秘:揭示预训练视觉语言模型的秘密
    PDF4 years ago
  • ACL混合 $h-1$ 个头比 $h$ 个头更好
    PDF4 years ago