BriefGPT.xyz
Ask
alpha
关键词
biased models
搜索结果 - 2
信息论模型预测 Q 学习
本研究提出了一种基于信息理论模型预测控制和熵正则化强化学习的 Q 学习算法,可以利用有偏模型,并在模拟控制任务中验证了该算法的有效性。
PDF
5 years ago
ICML
使用有偏表示学习没有偏见的表示
本文介绍了一种用于训练去偏置表示的新框架,通过鼓励其与一组从设计上存在偏差的表示不同来实现。该方法可在许多场景中使用,可以提高模型在不同类别中的泛化能力。
PDF
5 years ago
Prev
Next