Mar, 2024

AdaFish:利用二阶信息进行快速低秩参数高效微调

TL;DR介绍了一种高效的AdaFish算法,用于加快在低秩分解为基础的微调框架中的训练过程,该算法证明了全局收敛性和迭代/预言机复杂性,并通过数值实验与AdamW方法进行了竞争性比较。