Jul, 2021

自动主题模型评估是否存在问题?:连贯性的不连贯性

TL;DR通过将自动话的一致性与两种最广泛接受的人类判断任务进行比较,我们解决了话题模型评估中的验证鸿沟。与人类评估相比,自动评估宣布了一个获胜模型。