Mar, 2023

SemEval-2023 任务 11:软硬标签预测中激活函数的比较

TL;DR本文研究了应用不同的激活函数在深度神经网络模型的输出层上对于软或硬标签预测在学习中的不一致性任务上的影响,并使用 BERT 模型进行预处理和编码,并在保持其他参数不变的情况下改变输出层所使用的激活函数。最后使用软标签进行硬标签预测。本文提出了一种新的正弦激活函数,同时考虑了 Sigmoid 函数和基于步函数的激活函数。