ACLApr, 2024

多元观点,分歧模型:跨文化评估 Twitter 上的抑郁检测

TL;DR评估跨文化 Twitter 数据对建立跨文化 AI 模型的泛化性,结果显示抑郁症检测模型在全球化方面表现较差,特别是在全球南方用户中,预训练语言模型在泛化性方面表现最佳,但在抑郁和非西方用户的表现仍存在差距。我们对发现进行量化,并提供了一些建议来缓解此问题。