Jan, 2023

通过模型压缩提高推理性能,不增加计算时间

TL;DR使用不同的 Model Soups 并从中选出 Pruned Soup,比较了不同模型的表现,然后讨论了实验中发现的 weight-averaging 的局限性。