Mar, 2024

KIWI:应答研究问题的知识密集型写作指南数据集

TL;DR通过对 LLMs 在写作辅助任务上的能力进行评估,我们发现所有模型在将新信息纳入现有答案以及进行精确和明确编辑方面都有困难。此外,我们发现模型在判断其输出是否成功遵循用户指令方面也存在困难。研究结果表明,KIWI 将成为衡量进展和改进 LLMs 在知识密集型写作任务中的指令跟随能力的宝贵资源。