利用 BERT-Based 模型预测推文的地理位置
本文提出了一个简单而有效的模型,即真实来源模型,来解决 twitter 上的 “位置 A / B 问题”,该模型使用机器级自然语言理解来识别可能含有原始位置信息的推文,以达到国家,省市,乡镇和地区等级的有希望的准确性,并研究了多个推文的分布,以了解 Twitter 用户在提及原始和非原始位置方面的行为。
Nov, 2022
本研究提出了一种基于高斯混合模型的可扩展内容分析的方法,用于估算推文的地理位置,并提出了精度、准确度和校准等度量标准,并实现了对全球 1300 万条 Tweet 的实验,得出了可靠的、与以前的计算密集型方法相媲美的结果。
May, 2013
本文介绍了一种基于神经网络的层级位置预测模型,通过对用户所在国家和城市的层级结构进行考虑,并采用基于字符的词嵌入层来处理噪声数据,在不同特征组合设定下达到了最优结果,提高了预测精度并显著降低了均值误差距离。
Oct, 2019
本文提出了一种名为 MENET (Multi-Entry Neural Network Architecture) 的深度学习模型,能够综合使用利用 Twitter 用户生成内容、用户间连接性以及元数据等多种数据表示方式进行 Twitter 用户地理位置预测,且在三个基准数据集上表现显著优于现有方法。
Dec, 2017
本文旨在调查推特中的地理位置预测问题和机遇,重点关注用户家庭位置、推文位置和提及位置的预测,并综述了当前各种策略的优点与缺点,同时也简要介绍了语义位置预测和兴趣点推荐两个相关问题。
May, 2017
通过改进迭代算法并考虑基于文本的地理位置先验知识,我们提出了一种在社交媒体上进行地理位置预测的标签传播方法,实验证明该方法在三个 Twitter 基准数据集上取得了最优效果。
Jun, 2015
本文提出了一个基于神经网络的简单且有效的基于文本的用户地理定位模型,其在三个 Twitter 基准地理定位数据集上实现了最先进的性能,并且在隐藏层中生成词和短语嵌入,我们展示了这些嵌入有助于检测方言术语。作为我们方言术语分析的一部分,我们发布了一个评估方言术语检测方法的 DAREDS 数据集。
Apr, 2017
本研究提出了一个基于 BERT 的定位感知推荐系统,该系统可以从基于位置的社交媒体平台中提取位置信息,并根据用户的历史行为和偏好,为用户提供更相关的位置推荐结果,该模型在大量的实验数据集中一致优于现有的顺序模型。
Aug, 2022
通过比较使用 GPS 坐标和用户自报位置不同的语言分析方法,研究表明不同年龄和性别的人对特定主题的写作风格有所不同,并给出了男性 40 岁以上的文本地理定位最准确的结果。同时,年龄和性别是影响语言使用的重要变量。
Jun, 2015
在这篇论文中,我们提出了一个三步解决方案,旨在充分利用社交媒体内容和自然语言处理技术,实现灾害信息学中的相关分类、地点提取和主题建模,以应对社交媒体内容中的挑战。
May, 2024