Apr, 2024

Min-K%++:改进的基准模型用于检测大型语言模型的预训练数据

TL;DR通过使用整个词汇表的分类分布统计规范化目标词汇的概率,Min-K%++ 相对于 Min-K% 在检测预训练数据方面表现出更高的性能,且无需额外的参考模型。