Apr, 2024

通过虚构作品进行人物建模评估大型语言模型的人物理解能力

TL;DR我们提出使用角色概况任务来评估大型语言模型(LLMs)的角色理解能力,通过从对应的材料中总结角色概况,构建 CroSS 数据集并比较与下游任务的适用性,我们的实验结果强有力地验证了 LLMs 的角色理解能力,并且我们相信我们构建的资源将促进该领域的进一步研究。