关键词label smoothing regularization
搜索结果 - 2
- CVPR通过标签平滑正则化重新审视知识蒸馏
本文挑战了使用强大的 teacher model 教授弱 student model 的共识,详细阐述了 KD 和 label smoothing regularization 之间的关系,提出了 Teacher-free Knowledg - 用于有针对性情感分类的注意力编码网络
本文提出了一个名为 Attentional Encoder Network (AEN) 的网络,它使用基于注意力机制的编码器来处理上下文与目标之间的建模,采用标签平滑正则化来解决标签不可靠的问题,并将预训练的 BERT 应用于情感分类任务,