May, 2023
停止以纯文本格式上传测试数据:缓解评估基准数据污染的实用策略
Stop Uploading Test Data in Plain Text: Practical Strategies for Mitigating Data Contamination by Evaluation Benchmarks
Alon Jacovi, Avi Caciularu, Omer Goldman, Yoav Goldberg
TL;DR本研究提出了三种实用有效的策略来预防数据污染和确保模型能力的可信度,即使用公钥加密公开的测试数据、要求关闭 API 持有者采取训练排除控制并保护自己的测试数据、避免在互联网上出现已被解决的数据,并公开互联网衍生数据的背景。