Sep, 2023

Flesch 或 Fumble?评估教学调整的语言模型的可读性标准对齐

TL;DR对各种语言模型在书写故事补充和简化叙述等生成任务中根据标准的提示控制文本可读性进行性能调查的研究结果表明,ChatGPT 等全球认可的模型可能相对不够有效,需要更精细的提示,而像 BLOOMZ 和 FlanT5 这样的开放源码模型则显示出有希望的结果。