BriefGPT.xyz
Ask
alpha
关键词
penultimate layer
搜索结果 - 2
通过捕捉极端激活来减轻对于外部分布检测中的过度自信
通过测量神经网络次最后一层的极端激活值并利用这一特征改进各种 OOD 检测基线,我们解决了模型 “过度自信” 现象造成的 OOD 检测问题,在各类实验中得到了显著提升,不损害任何场景的性能。
PDF
2 months ago
面向极大输出空间的记忆高效训练 —— 在单一通用 GPU 上使用 50 万标签进行学习
在大规模输出空间分类问题中,通过使用中间大小的倒数第二层和限制稀疏层的连通性为均匀,可有效降低 GPU 硬件上的内存需求,并缓解由稀疏层连通性引起的模型预测力度下降问题。
PDF
a year ago
Prev
Next