Mar, 2024

学习向人群推迟决策的元学习方法

TL;DR学习推迟(L2D)框架通过将困难决策交给人类专家,实现了自主系统的安全性和稳健性。我们在此工作中缓解了每个专家都是明确识别的假设,并设计了一个能够应对测试时从未遇到过的专家的 L2D 系统。我们使用元学习来实现这一目标,同时考虑了基于优化和基于模型的变种。通过给出用于描述当前可用专家的小的上下文集合,我们的框架可以快速适应其推迟策略。对于基于模型的方法,我们采用了一种注意机制,可以查找上下文集合中与给定测试点相似的点,从而更精确地评估专家的能力。在实验中,我们在图像识别、交通标志检测和皮肤病病变诊断基准上验证了我们的方法。