Jan, 2024

人工与合成测试数据以及往返传送对偏见情感分析系统评估的影响

TL;DR通过评估情感分析系统(SAS)在黑盒环境中,加入人工生成的聊天机器人数据集以及往返翻译设置,我们发现这些设置更真实地展现了 SAS 在现实中的表现,揭示了 SAS 在聊天机器人数据中存在更多偏见,而使用西班牙语和丹麦语作为中介语言往返翻译能减少人工生成数据中的偏见(最多可减少 68%),而在合成数据中则会增加偏见!这些发现将帮助研究人员和从业人员完善 SAS 测试策略,增强对 SAS 的信任,因为 SAS 被认为是全球性更为关键的应用的一部分。