Oct, 2023

抑制复制:全面理解注意力头

TL;DRGPT-2 Small 模型的 Attention Head 10.7 (L10H7) 通过抑制复制行为实现模型校准和自修复。