Oct, 2023

Mini-BEHAVIOR: 基于过程生成的长时决策机载人工智能评测基准

TL;DR我们提出了 Mini-BEHAVIOR,一个新颖的基准,用于对智能体进行理性和决策方面的挑战,以解决类似于日常人类挑战的复杂活动。Mini-BEHAVIOR 提供了一个快速、开放式的评估机制,用于评估具体决策和规划解决方案在具体化的 AI 中。