BriefGPT.xyz
Feb, 2021
线性赌博机和线性强化学习的近似最优表示学习
Near-optimal Representation Learning for Linear Bandits and Linear RL
HTML
PDF
Jiachen Hu, Xiaoyu Chen, Chi Jin, Lihong Li, Liwei Wang
TL;DR
研究多任务线性臂和线性价值函数近似下的表示学习,并提出了一个可共享表示的算法,可在多任务和时间步数下实现更小的遗憾。
Abstract
This paper studies
representation learning
for
multi-task
linear bandits
and
→