Sep, 2023

医疗表格数据中的超出分布检测基准

TL;DR机器学习模型在现实世界的医疗系统中可靠地运用和避免在分布之外的数据上产生不准确的预测是非常重要的。该研究提出了一个全面的可复现基准测试,比较了不同方法在接近和远离分布之外的数据上的表现,特别关注医疗表格数据的处理。研究发现对于远离分布之外的数据,问题似乎已经解决,但对于接近分布之外的数据仍然存在挑战。此外,将后处理方法与基于距离的机制结合可以显著改善性能,而 Transformer 架构相对于 MLP 和 ResNet 架构来说更加保守。