ICMLDec, 2022

无监督检测上下文嵌入偏差及其对意识形态的应用

TL;DR我们提出了一种完全无监督的方法来检测上下文嵌入中的偏差。该方法利用社交网络中隐含的同质性信息,并结合正交性正则化、结构稀疏学习和图神经网络来发现捕捉这些信息的嵌入子空间。在具体的例子中,我们关注意识形态偏差现象:我们引入了意识形态子空间的概念,展示了如何将我们的方法应用于在线讨论论坛来找到它,并提出了探究它的技术。我们的实验表明,意识形态子空间编码抽象的评价语义,反映了唐纳德・特朗普总统任期期间政治左右谱的变化。