Dec, 2022

变量决策频率选项评论家

TL;DR本研究提出一种名为 CTCO 的框架,使学习智能体通过选择变量持续时间的子策略来实现在可能的情况下以低频率运作,并在必要时以高频率运作,从而克服了决策频率选择的困难。