Nov, 2023

您确定吗?在 FlipFlop 实验中挑战 LLMs 导致性能下降

TL;DR通过 FlipFlop 实验,该研究探讨了大型语言模型的多轮互动行为,发现模型在回答问题时会反思并改进答案,提供了分析模型行为和评估潜在解决方案的可靠框架。