Jun, 2024

使用 LLMs 生成具有不同可读性水平的教育材料

TL;DR本研究介绍了分级文本生成任务,旨在将教育材料重写为特定可读性水平同时保持意义不变。通过零 - shot 和少量样本提示,我们评估了 GPT-3.5、LLaMA-2 70B 和 Mixtral 8x7B 在不同可读性水平上生成内容的能力。对 100 份处理过的教育材料进行评估,结果显示少量样本提示显著提高了可读性操作和信息保留的性能。LLaMA-2 70B 在实现所需难度范围方面表现更好,而 GPT-3.5 保持了原始意义。然而,手动检查还揭示出了诸如引入错误信息和不一致的编辑分布等问题。这些发现强调了进一步研究以确保生成的教育内容的质量的需求。