Jul, 2023

迈向可信赖和对齐的机器学习:一个以数据为中心的带因果关系观点的综述

TL;DR机器学习的可信度是一个重要的话题,涉及到鲁棒性、安全性、可解释性和公平性等各种应用和研究领域。本文系统地从数据中心的角度回顾了这些进展,突出了传统经验风险最小化(ERM)训练处理数据挑战的不足之处,提供了一种统一的语言和数学词汇将这些方法连接起来,促进对该领域的更加协调的理解,并讨论了由因果性文献明确启发的方法。同时,还对大型预训练模型的可信度展开了探讨,并将其与标准ERM进行联系,为未来方法铺平道路。最后,对这些方法的应用和未来潜在方面进行了简要总结和讨论。