Jul, 2024

抽象对齐:模型与人类概念关系的比较

TL;DR将机器学习模型的抽象与人类预期的抽象进行比较,量化其一致性,以提供对模型行为和数据集内容的更深入理解,并通过区分基于其与人类知识的一致性的错误,扩大当前模型质量指标的详细性,揭示改进现有人类抽象的方式。