Oct, 2023

驯服 Sigmoid 瓶颈:可证明的稀疏多标签分类算法

TL;DR在多标签分类任务中,sigmoid 输出层广泛应用;本文展示了类似 sigmoid 的瓶颈会导致指数级别的无法预测的标签组合;我们提出了一种离散傅立叶变换输出层,可以防止这种情况的发生,并且相较于 sigmoid 输出层,训练速度更快、参数利用更高效,能够在使用更少的可调参数的同时与 sigmoid 输出层达到相似的 F1 度量指标。