May, 2023

LACoS-BLOOM:基于对比目标的 8 位 Siamese-BLOOM 低秩适应

TL;DR本文介绍了一种低秩适配器、基于对比目标的多语言大型语言模型 Siamese-BLOOM 和可扩展适配器 LoRA 以及 8 位 Adam 优化器,用于句子相似性分类。通过在 BLOOM 模型上应用对比目标的 Siamese 架构,解决了多语言标记数据稀缺的问题,并证明了从 LACoS-BLOOM 中学习到的嵌入质量与模型参数数量和未标记的训练数据量成比例,相对于以前的解决方案 Sentence-BERT,在英语和多语言 STS 任务上均取得了显着的改善。