ACLApr, 2024

LLM 不适用时使用 FastFit: 快速高效的多类别文本分类

TL;DRFastFit 是一个 Python 包,利用批量对比学习和令牌级相似度评分的新方法,为许多语义相似类别的情况下提供快速准确的少样本分类。相较于现有的少样本学习包,如 SetFit、Transformers 或通过 API 调用大型语言模型的少样本提示,FastFit 在 FewMany 和多语种数据集中显著提高多类分类性能,训练速度提升 3-20 倍,在几秒钟内完成训练。FastFit 包已在 GitHub 和 PyPi 上提供,为自然语言处理研究人员提供了用户友好的解决方案。