Mar, 2024

解码压缩的信任:压缩下高效 LLM 的可信度审查

TL;DR通过评估三个领先的大型语言模型在八个可信度维度上使用五种最先进的压缩技术的结果,本研究发现,与剪枝相比,量化在同时实现高效和可信性方面更具有效性。此外,适度位数范围内的量化可以意外地提高某些可信度维度,例如道德和公平性。这些发现提供了在大型语言模型中同时实现高效、可用性和可信性的实用建议。