Nov, 2022

理解 BLOOM:多元自然语言处理任务的实证研究

TL;DR通过评估较小的 BLOOM 模型变体(350m / 560m 和 1b3 / 1b7),我们发现:(1)与 GPT 和 BERT 等 LLM 不同,BLOOM 表现不随参数大小变化;(2)跨语言和多语言微调实验证明 BLOOM 与单语 GPT-2 模型相当或更差;(3)使用 RealToxicityPrompts 数据集的提示文本生成的毒性分析表明,BLOOM 生成的文本至少比 GPT-2 和 GPT-3 模型不良反应低 17%。