关键词tsallis entropy
搜索结果 - 11
- LC-Tsalis-INF: 广义的两全其美线性上下文决策者PDF4 months ago
- 线性可解的 MDP 与线性二次调节器的 Tsallis 熵正则化PDF4 months ago
- 特征模仿的广泛影响:在金融、语音和生理领域的神经增强PDF10 months ago
- 具有修剪的隐式归一化线性和非线性重尾多臂赌博机预测器PDFa year ago
- 通过优势学习施行 KL 正则化的一般 Tsallis 熵强化学习PDF2 years ago
- Q-Munchausen 强化学习PDF2 years ago
- 领域自适应的循环自训练PDF3 years ago
- Tsallis-INF:用于随机和对抗赌徒的最优算法PDF6 years ago
- Tsallis 熵正则化 MDP 中的路径一致性学习PDF6 years ago
- NIPS用一种新的平滑度对抗强盗PDF9 years ago
- 超越 Tsallis 和 Renyi 熵PDF19 years ago
Prev
Next