ACLMay, 2023

HiFi: 高信息注意力头用于参数有效的模型调整

TL;DR本文提出了一种名为 HiFi 的参数高效的微调方法,即只微调与特定任务高度相关的信息丰富且高度相关的注意力头,该方法使用 PageRank 算法搜索显著的注意力头,实验证明 HiFi 方法在 GLUE 基准测试中获得了先进的性能。