Oct, 2023

在线决策调解

TL;DR提出了一种决策支持助手,用于在专家行为和人类行为之间充当中介;通过学习决策中介策略,并在顾及直接损失与未来泛化错误改进之间进行权衡,可以获得性能上的一致增益。