Mar, 2025
猜猜我在想什么:角色扮演语言代理的内在思维推理基准
Guess What I am Thinking: A Benchmark for Inner Thought Reasoning of
Role-Playing Language Agents
TL;DR本研究填补了角色扮演语言代理(RPLA)内在思维过程未被探索的空白,提出了一个名为ROLETHINK的新基准,用于评估角色思维生成。通过提出内在思维推理任务及应用MIRROR方法,我们的实验表明,内在思维推理对RPLA至关重要,并且MIRROR方法在性能上持续优于现有技术。