May, 2023

RLBoost: 使用深度强化学习提升监督学习模型

TL;DR本文介绍了 RLBoost 算法,它使用深度强化学习策略评估数据集并获得一个能够估计任何新数据质量的模型,以提高监督学习模型的最终预测质量。该算法通过多关注策略,考虑了数据的上下文信息,与其他现有算法相比具有更好和更稳定的结果。