ICMLMay, 2023
具有强鲁棒性保证的边加权在线二分匹配学习
Learning for Edge-Weighted Online Bipartite Matching with Robustness Guarantees
Pengfei Li, Jianyi Yang, Shaolei Ren
TL;DR本研究提出了一种基于强化学习的新型边权重在线二分图匹配方法(LOMAR),以实现良好的平均情况和最坏情况下的性能,其中,关键新颖的操作是根据谨慎的条件决定是否跟随专家的决策还是 RL 决策。