Aug, 2023

高效基准测试(语言模型)

TL;DR使用 LM 评估的计算成本的智能减少,提高效率,保证可靠性,从而显著降低计算量并保持基准可靠性,通常减少计算量 100 倍或更多。