BriefGPT.xyz
Ask
alpha
关键词
intervention-based learning
搜索结果 - 2
ReIL: 基于强化干预的模仿学习框架
本文提出了一种基于增强和干预的多任务学习框架 --ReIL,该框架旨在实现在无需过多监督和调整的情况下,在真实环境中训练代理。实验结果表明,相较于其他基于干预的方法,ReIL 使用任意奖励函数进行训练时无需使用额外启发式方法,能够在稀疏监督
→
PDF
2 years ago
MM
DeVLBert:学习去混淆视觉语言表征
本文提出了 Deconfounded Visio-Linguistic Bert 框架,解决了视觉语言预训练中的跨域问题,并通过干预学习减轻数据集偏差,从而提高了模型的泛化能力。
PDF
4 years ago
Prev
Next