Sep, 2024

真实还是机械?评估大型语言模型在对话中是否准确模拟人类响应的特质

TL;DR本研究解决了大型语言模型(LLMs)在模拟人类对话时的准确性问题。我们提出了一种方法,通过生成和分析10万个LLM与人类的对话对,发现LLM模拟与人类对话之间存在显著差异,尤其在文本风格和内容上。这项工作强调了LLMs的局限性,并指出人类在更接近LLM风格的写作时,模型的表现有所改善。