BriefGPT.xyz
大模型
Ask
alpha
关键词
collaborative interactions
搜索结果 - 2
CVPR
互动式连续学习:快思和慢思
基于互动持续学习框架,使用大型语言模型与记忆检索机制,以及模型之间的协作交互,实现抵抗遗忘和优越性能的持续学习。
PDF
4 months ago
基于实时反馈的指令跟随持续学习
通过人机协作交互提供的实时二元反馈,用自然语言训练指令遵从代理的问题被研究。将学习作为一种上下文医师问题,将用户反馈转换为立即奖励,证明了其在提高指令执行效果方面具有优势,并且反馈信号与监督式演示数据的学习信号基本等价。
PDF
2 years ago
Prev
Next