Jan, 2024
AntEval: 评估代理人社交互动的信息量和表达能力
AntEval: Quantitatively Evaluating Informativeness and Expressiveness of
Agent Social Interactions
TL;DR以桌上角色扮演游戏的规则为基础,通过引入代理交互评估框架(AntEval),提出了两个新的评估指标:信息交换精度(IEP)和交互表达差距(IEG),以评估大语言模型在复杂代理交互中的信息量和表达能力,为进一步探索复杂代理交互提供指导,引导其更接近模拟真实人类行为,并提升在实际应用中的整合性和实用性。