Mar, 2024

MA4DIV:多智能体强化学习用于搜索结果多样化

TL;DR多智能体强化学习方法 MA4DIV 能够在搜索结果多样化过程中直接优化多样性指标,并在合作任务中实现高效培训,并在工业规模数据集上实现了比现有基线方法更高的效果和效率提升。