IJCAIJun, 2023

概率向量排序与无监督性能评估

TL;DR通常用于评估模型性能的无标签数据评估的方法,通过使用得分函数映射概率向量来提高效果,但是需要选用最佳得分函数,实验得出 L^∞范数是最合适的。