Apr, 2014

利用总变差最小化对一亿个 Twitter 账户进行地理标记

TL;DR本研究提供了一种能够在公开可见的 Twitter 数据的基础上,准确地确定 Twitter 用户位置的方法。通过优化社交网络中的用户位置并检视他们好友的位置,本文提供了一种高可扩展性和可分布式的算法,并展示了如何利用用户的 ego 网络的地理离散度来作为准确性度量的参数。本文的实验结果表明,在 101,846,236 位 Twitter 用户的位置中,其中 80% 以上的公开推文地理标记的中位误差为 6.38 公里。