BriefGPT.xyz
Ask
alpha
关键词
pretraining and finetuning
搜索结果 - 2
ICML
OLLIE: 离线预训练到在线微调的模仿学习
这篇论文研究了离线到在线模仿学习(IL),该方法从静态示范数据中预训练一个模仿策略,然后通过最小的环境交互快速微调。通过研究发现现有的离线 IL 和在线 IL 方法的原始组合在这个情景下表现不佳,因为初始鉴别器(通常在在线 IL 中使用)随
→
PDF
a month ago
超参数化神经网络中多任务学习和微调的隐式正则化
通过研究辅助任务的学习,我们发现其对特征共享和任务特定特征的稀疏性进行了激励,同时提出了一种修改了预训练和微调方法以提高性能的技术。
PDF
9 months ago
Prev
Next