BriefGPT.xyz
大模型
Ask
alpha
关键词
ood benchmark
搜索结果 - 2
外部分布检测应该使用符合性预测(反之亦然?)
提供了一种使用 Conformal Prediction(CP)来更好评估 OOD 分数的方法,并通过引入新的 conformal AUROC 和 conformal FRP@TPR95 度量对 OOD 基准进行了改进,同时展示了 OOD
→
PDF
4 months ago
SIGIR
Do-GOOD:针对预训练视觉文档理解模型的分布转移评估
本研究基于文档图像相关任务,开发了一个名为 Do-GOOD 的 OOD 基准,探究现有预训练 VDU 模型对各种分布转移的鲁棒性及其脆弱性。实验结果发现,在文档图像领域,现有预训练 VDU 模型以及 OOD 泛化算法在分布转移方面表现出较大
→
PDF
a year ago
Prev
Next