May, 2023

使用 NERO 评估机器学习模型:在轨道上揭示非等变性

TL;DR提出一个名为 NERO Evaluation 的新型评估流程,旨在关注模型的等变性、紧密捕捉模型的可靠性,并通过模型输出的交互式可视化效果有效地解释模型行为。同时,提出一种替代基于真实值的方法 —— 共识方法,以评估模型的等变性。