May, 2024
视觉语言模型易于执行时适应的令人沮丧的测试
Frustratingly Easy Test-Time Adaptation of Vision-Language Models
Matteo Farina, Gianni Franchi, Giovanni Iacca, Massimiliano Mancini, Elisa Ricci
TL;DR研究表明,零温度的 TTA 方法(ZERO)能够在只进行一次前向传播的情况下,准确性大大超过或与现有技术相当,且速度约为 10 倍快,内存占用约为 13 倍少。