Mar, 2024

双分图变分自编码器用公平潜在表示解决生态网络中的抽样偏差

TL;DR我们提出了一种方法来表示双分图网络,使用定制的图嵌入方法来解决研究生态网络时面临的挑战,特别是需要考虑许多协变量,尤其是为了控制采样偏差。我们将变分图自编码器方法改编为双分图的情况,这使我们能够在潜在空间中生成节点的嵌入,这两组节点的位置是基于它们的连接概率确定的。我们将社会学中常用的公平框架转化为生态学中解决采样偏差的方法。通过将 Hilbert-Schmidt 独立性准则(HSIC)作为损失函数中的附加惩罚项进行优化,我们确保潜在空间的结构与与采样过程相关的连续变量无关。最后,我们展示了当应用于 Spipoll 数据集时,我们的方法如何改变我们对生态网络的理解,这是一个众包式的植物 - 传粉者相互作用的公众科学监测计划,容易出现采样偏差。