BriefGPT.xyz
大模型
Ask
alpha
关键词
follow-the-leader
搜索结果 - 3
实例最优在线学习的 SMART 方法
我们提出了一种在线学习算法 —— 通过单调适应性遗憾追踪(SMART)进行切换,它适应数据并实现了在每个输入序列上相对于领导者跟随(FTL)策略的表现和任何其他输入策略的最坏情况保证同时有效的遗憾,通过我们的算法,我们证明 SMART 政策
→
PDF
4 months ago
ICLR
本地敏感稀疏编码用于在线学习世界模型
在线学习是一项具有挑战性的任务,由于数据非稳态性,神经网络通常会导致灾难性遗忘,线性回归模型支持非线性随机特征,以实现高效的 Follow-The-Leader 更新,通过局部敏感稀疏编码实现高维非线性特征的高效稀疏更新,我们验证了编码的表
→
PDF
5 months ago
跟随领袖如果可以,如果必要则对冲
介绍了一种名为 FlipFlop 算法的新方法,该方法将 Follow-the-Leader 算法和 AdaHedge 策略相结合,同时不会牺牲前者的强势表现和后者的最坏情况保证。
PDF
12 years ago
Prev
Next