Feb, 2024

LLM 在谈判对话中的多维能力的系统评估

TL;DR通过分析 LLMs 在各种对话场景中的多面能力,该研究旨在了解 LLMs 如何推进不同方面的谈判研究,包括设计对话系统、提供教学反馈和扩大数据收集实践。结果表明,虽然 GPT-4 在各种任务上表现出优越性,但在主观评估谈判对话和生成上下文恰当且战略优势的回复方面,模型与人类玩家的相关性较差、往往困难重重。