Jan, 2023

与人类表征的对齐支持强大的少样本学习

TL;DR通过信息理论分析和计算机视觉模型的实验,我们发现 AI 系统的世界表示与人类的相似度呈现 U 形关系,并表明高度相似的模型在少量数据、对抗攻击和领域转换方面更具鲁棒性和泛化能力,表明人类对齐通常是模型充分利用有限数据、鲁棒性和良好泛化的足够但不必要的条件。