Apr, 2024

ChatShop: 与语言代理商进行交互式信息搜索

TL;DR我们使用网络购物任务作为示例,将其重新定义为一个信息检索任务,并引入购物者角色作为一个受限通信通道,以此来评估语言智能代理系统探索和积累信息的能力。我们的实验证明,该任务能够有效地评估代理系统通过多轮交互获取和积累信息的能力。同时,我们发现基于 LLM 模拟的购物者在错误模式方面与真实人类购物者存在相似性。