Nov, 2022

多智体合奏的端到端优化与学习

TL;DR本文提出了一种名为 e2e-MEL 的策略,通过将约束优化和学习相结合,将集成学习任务变成可微分的选择程序,学习为特定输入样本选择适当的预测器进行组合,结果表明,e2e-MEL 在各种设置中都可以明显优于传统共识规则。