Jun, 2023

语义 HELM: 一种可解释的强化学习记忆

TL;DR这篇研究通过使用 CLIP 将视觉输入与语言标记联系起来,利用预训练的语言模型作为代理的记忆来提供一个连贯且可解释的过去表征,实现了最先进的性能和在需要记忆过去才能解决任务的环境中表现出优势和劣势,具有可解释性。