BriefGPT.xyz
Aug, 2021
利用统计检验来建立表示相似性
Grounding Representation Similarity with Statistical Testing
HTML
PDF
Frances Ding, Jean-Stanislas Denain, Jacob Steinhardt
TL;DR
本文提供了一个框架来验证神经网络的行为,通过功能行为敏感性和特异性等方面测试常用的神经网络模型评估方法,研究发现当前的评估指标存在不同缺陷,一个经典的基线表现出人意料的好,作者对所有指标都无法胜任的场景进行了强调,并为未来的研究提供了挑战性的基础数据。
Abstract
To understand
neural network behavior
, recent works quantitatively compare different networks' learned representations using
canonical correlation analysis
(CCA),
→