Jul, 2024

大型语言模型生成上下文相关问题的比较

TL;DR本研究探讨了大型语言模型(LLMs)在教育环境中自动生成问题的有效性,并比较了三种模型在无微调情况下从大学幻灯片文本中生成问题的能力。研究发现,GPT-3.5和Llama 2-Chat 13B在问题的清晰度和问答对应性方面略优于Flan T5 XXL,特别是GPT-3.5在根据输入答案定制问题方面表现突出。