关键词classification benchmark
搜索结果 - 2
- 通过未标记数据的不确定性估计缓解语义分割中的分布偏移
基于未标记数据的 Gamma-SSL 方法通过选择性强制一致性来进行不确定性估计,用于在自动驾驶环境中检测语义分割模型的错误。在具有挑战性的分类基准上,该方法在 ROC 曲线下面积和 PR 曲线下面积方面的表现超过了不确定性估计和离群分布技 - 通过口头化调整进行命令跟踪评估
我们提出了一种名为 verbalizer manipulation 的新型指令跟踪评估协议,该协议通过使用高度匹配到轻微匹配的语言转化器,结合任何分类基准来检查模型对先验知识的依赖程度以及其是否能准确遵循指令。我们对四个重要的模型系列进行了