Jul, 2023

用奖励重新加权、重新选择和重新训练提升原型部分网络

TL;DR通过人类反馈加强训练的模型 (R3-ProtoPNet) 提高解释性,同时保持可理解性,适用于多模型集成提高预测性能。