BriefGPT.xyz
Ask
alpha
关键词
control domains
搜索结果 - 2
TAIL:大型预训练模型的任务专用适配器用于模仿学习
TAIL 框架通过使用 LoRA 技术实现对大型预训练模型的高效适应,其在新任务中只使用了 1% 的可训练参数,避免了灾难性遗忘并保持了持续学习环境中的适应能力。
PDF
9 months ago
将 LLM 和决策变压器相结合,实现语言操作的生成与多样共存
通过使用大型语言模型扩充轨迹的自然语言描述,我们提出了一种方法来解决质量 - 多样性问题,允许用户指定任意目标行为描述,并通过高层次的文本提示来塑造生成的轨迹。同时,我们还提出了一种基于大型语言模型的评估方法,并使用 2D 迷宫中的模拟机器
→
PDF
10 months ago
Prev
Next