BriefGPT.xyz
Ask
alpha
关键词
payoff function
搜索结果 - 2
通过寻求帮助避免连续空间中的灾难
通过假设每个回合的付出代表避免灾难的机会,我们提出了一种上下文匹配问题的变体,目标是尽量减少灾难的可能性,进而通过最大化付出的乘积来尽量避免灾难的总体机会。我们提供了一个算法,可以在时间范围增长时使后悔和对导师提问的频率都趋近于 0,假设有
→
PDF
5 months ago
广义形式博弈中针对承诺的最优私人收益操纵
通过对追随者私有收益信息的误报,实现最优操纵是一个多项式时间可解的问题,不同态度的追随者对此有不同的态度。此项研究解决了这个广泛的问题。
PDF
2 years ago
Prev
Next