Jul, 2024

在线决策的自适应基础模型:具有快速增量式不确定性估计的超级智能体

TL;DRGPT-HyperAgent是GPT的改进版本,用于处理基于自然语言输入的在线决策问题中的不确定性,通过与HyperAgent相结合,实现了可扩展的探索。它在实验中验证了其在实际的安全关键决策中的有效性。