Jun, 2024

结合监督学习与强化学习用于多标签分类任务中的部分标签

TL;DR我们提出了基于强化学习的 RLAC 框架,通过结合强化学习的探索能力和监督学习的开发能力,解决了多标签正负样本学习问题,并在多个任务中进行实验证明了我们框架的泛化和有效性。