Sep, 2023
LLM-Deliberation:用互动多智能体协商游戏评估 LLMs
LLM-Deliberation: Evaluating LLMs with Interactive Multi-Agent Negotiation Games
Sahar Abdelnabi, Amr Gomaa, Sarath Sivaprasad, Lea Schönherr, Mario Fritz
TL;DR使用可评分的协商游戏作为新的评估框架,系统化的零样本链式思考提示能够展示大型语言模型在协商中的能力和绩效差距。