Dec, 2023

LLF-Bench:交互学习语言反馈的基准测试

TL;DRLLF-Bench 是一个用于评估 AI 代理从自然语言反馈和指导中进行交互学习能力的新基准,包括用户推荐、写诗、导航和机器人控制等任务,拥有随机化技术和统一的 OpenAI Gym 接口,可用于开发和测试 LLF 代理。