Jan, 2024

元认知是否就足够了?在生成式代理中使用内省来改进目标导向行为

TL;DR介绍了一种元认知模块,使生成式智能体能够观察自己的思维过程和行为,从而显著提高性能并改进策略。在多种情景中进行了测试,包括求生僵尸启示录,发现我们的系统胜过其他系统,而且智能体随着时间适应并改进任务策略。