Apr, 2022

检查 HateCheck: 行为感知学习在仇恨言论检测中的跨职能分析

TL;DR本研究探讨了行为感知学习,通过探索几个微调方案使用 HateCheck,针对几个仅包含预期输出的情况对模型进行训练和评估,提高了分类准确性并暗示其可能泛化到被忽视的功能上。