Twitter 上位置预测的调查
本文回顾了 Twitter 用户位置推断技术的发展历程,探讨了地理位置信息获取和算法优化对准确性提升的积极影响,并强调了其在社交媒体、灾害监测、市场趋势研究等领域的广泛应用。
Jan, 2017
本文研究了三种自动语言识别方法与 Twitter 用户界面语言设置和语言人工编码之间的可靠性,比较了用户输入的个人资料位置与实际发推地点之间的不同,证明了用户生成的资料位置无法用作推特信息发布的有用代理。
Aug, 2013
本文提出了一个简单而有效的模型,即真实来源模型,来解决 twitter 上的 “位置 A / B 问题”,该模型使用机器级自然语言理解来识别可能含有原始位置信息的推文,以达到国家,省市,乡镇和地区等级的有希望的准确性,并研究了多个推文的分布,以了解 Twitter 用户在提及原始和非原始位置方面的行为。
Nov, 2022
本文介绍了如何将全球推文分类到各自的国家,通过使用八种推文本身固有的特征进行分类,并结合历史推文训练模型来分类新的推文。最佳的分类结果需要利用推文内容和元数据的适当组合。
Apr, 2016
本研究提出了一种基于高斯混合模型的可扩展内容分析的方法,用于估算推文的地理位置,并提出了精度、准确度和校准等度量标准,并实现了对全球 1300 万条 Tweet 的实验,得出了可靠的、与以前的计算密集型方法相媲美的结果。
May, 2013
本文介绍了一种基于神经网络的层级位置预测模型,通过对用户所在国家和城市的层级结构进行考虑,并采用基于字符的词嵌入层来处理噪声数据,在不同特征组合设定下达到了最优结果,提高了预测精度并显著降低了均值误差距离。
Oct, 2019
使用神经网络、自然语言处理以及高斯混合模型,对推特文本中的地理位置进行预测,在全球范围以及美国范围内实验结果的中位误差分别小于 30 公里和 15 公里。
Mar, 2023
研究了社交媒体文本与所发布地点类型之间的关系,提出了一个包含大约 200,000 条英文推文的新数据集,用于预测推文所发布的位置类型,并训练分类器来预测推文所发送的位置类型,能够达到宏观 F1 值 43.67,并揭示了与每种类型场所相关的语言标记,这种能够从推文中预测语义场所信息的能力在推荐系统、个性化服务和文化地理学中应用广泛。
Sep, 2020
本文提出了一种名为 MENET (Multi-Entry Neural Network Architecture) 的深度学习模型,能够综合使用利用 Twitter 用户生成内容、用户间连接性以及元数据等多种数据表示方式进行 Twitter 用户地理位置预测,且在三个基准数据集上表现显著优于现有方法。
Dec, 2017
通过比较使用 GPS 坐标和用户自报位置不同的语言分析方法,研究表明不同年龄和性别的人对特定主题的写作风格有所不同,并给出了男性 40 岁以上的文本地理定位最准确的结果。同时,年龄和性别是影响语言使用的重要变量。
Jun, 2015