Jun, 2024

动态去偏:基于解释的人工监督机器学习系统决策

TL;DR提出了一种新颖的在部署的机器学习系统中跟踪和纠正歧视的方法,它利用反事实解释来持续监测机器学习系统的预测,并标记歧视性结果,然后将与原始预测和反事实替代方案相关的后续解释呈现给人工审查者进行实时干预,从而实现公平和负责任的机器学习操作。