Jun, 2024

边缘修剪中的 Transformer 电路寻找

TL;DR自动电路发现的一种有效且可扩展的解决方案是基于优化问题的边缘修剪,该方法在 GPT-2 模型中找到使用少于一半边缘的电路,并与之前的方法在速度和质量上表现出优势。