BriefGPT.xyz
Ask
alpha
关键词
optimization oracle
搜索结果 - 5
在线多组学习的分组式高效算法
我们研究在线多组学习的问题,这是一个学习模型,其中在线学习器必须同时在一个大规模的(可能有重叠的)子序列集合上实现小的预测遗憾,这些子序列对应于一个组的家族。在本文中,我们设计了这样的支持优化预测的算法,在多种情况下拥有亚线性的遗憾,包括:
→
PDF
a month ago
随机分割超平面定理与学习多面体
用随机分离超平面定理和多边形优化算子解决学习多面体中的 Hausdorff 问题,得到多个近似顶点的方法,以及可能的多面体顶点近似算法的首个有效算法。
PDF
a year ago
私人合成数据发布的新型高效算法
提出了三种新的算法,用于构建差分隐私合成数据,且算法在最坏情况下具有差分隐私,通过理论分析和实证评估,确保准确性与隐私性。
PDF
4 years ago
在线非凸学习:跟随扰动领袖是最优的
研究基于非凸损失的在线学习问题,证明了经典的 Perturbed Leader 算法在该设置下可达到最佳遗憾率,进一步证明乐观的 FTPL 算法在序列损失可预测时的遗憾界更优。
PDF
5 years ago
使用谱方法强化学习 POMDPs
提出了一种新的强化学习算法用于部分可观察的马尔可夫决策过程 (POMDP),该算法基于谱分解方法,学习参数通过固定政策生成的轨迹,并通过优化 oracle 返回最优的无记忆规划策略,算法可以有效缩放观测和行动空间的维度。
PDF
8 years ago
Prev
Next