BriefGPT.xyz
Ask
alpha
关键词
agent adaptation
搜索结果 - 2
自适应惊喜内在动机的无监督强化学习
提出了一个基于多臂赌博机问题的代理模型,该模型根据环境的熵条件动态调整目标,从而鼓励在不同熵环境中出现新的行为和学习技能。
PDF
a month ago
通过通信改进 LLM 代理
基于大语言模型,提出了通过交流学习(LTC)的训练方法,使得代理人能够不断地通过与环境和其他代理的互动进行改进,通过三种结构化通信模式进行特定任务的学习,并在不同领域展现了 LTC 方法的多样性和效率。
PDF
9 months ago
Prev
Next