ACLFeb, 2023

实时视觉反馈用于引导基准创建:人 - 指标协同的工作流程

TL;DR该篇论文提出了一种基于引导群众工作者的新型自然语言处理(NLP)基准创建范例 VAIDA,以减少创建样本中的人为偏差,并通过 NASA TLX 用户研究及专业评估证实,减少了创建样本的人力、时间投入的同时,增加了样本的整体性与质量,并降低了不同模型的创建样本的表现效果,观察到创建样本对多种模型有攻击性。