利用 BERT-Based 模型预测推文的地理位置

Mar, 2023

利用 BERT-Based 模型预测推文的地理位置

Geolocation Predicting of Tweets Using BERT-Based Models

Kateryna Lutsai, Christoph H. Lampert

TL;DR使用神经网络、自然语言处理以及高斯混合模型，对推特文本中的地理位置进行预测，在全球范围以及美国范围内实验结果的中位误差分别小于 30 公里和 15 公里。

Abstract

This research is aimed to solve the tweet/user geolocation prediction task and provide a flexible methodology for the geotagging of textual big data. The suggested approach implements →

tweet geolocation neural networks nlp gmms

发现论文，激发创造

基于上下文信息推断推文来源地

本文提出了一个简单而有效的模型，即真实来源模型，来解决 twitter 上的 “位置 A / B 问题”，该模型使用机器级自然语言理解来识别可能含有原始位置信息的推文，以达到国家，省市，乡镇和地区等级的有希望的准确性，并研究了多个推文的分布，以了解 Twitter 用户在提及原始和非原始位置方面的行为。

Nov, 2022

使用定量信心推断推文的来源地

本研究提出了一种基于高斯混合模型的可扩展内容分析的方法，用于估算推文的地理位置，并提出了精度、准确度和校准等度量标准，并实现了对全球 1300 万条 Tweet 的实验，得出了可靠的、与以前的计算密集型方法相媲美的结果。

May, 2013

Twitter 用户地理位置预测的分层神经网络

本文介绍了一种基于神经网络的层级位置预测模型，通过对用户所在国家和城市的层级结构进行考虑，并采用基于字符的词嵌入层来处理噪声数据，在不同特征组合设定下达到了最优结果，提高了预测精度并显著降低了均值误差距离。

Oct, 2019

多视角深度学习预测 Twitter 用户位置

本文提出了一种名为 MENET (Multi-Entry Neural Network Architecture) 的深度学习模型，能够综合使用利用 Twitter 用户生成内容、用户间连接性以及元数据等多种数据表示方式进行 Twitter 用户地理位置预测，且在三个基准数据集上表现显著优于现有方法。

Dec, 2017

Twitter 上位置预测的调查

本文旨在调查推特中的地理位置预测问题和机遇，重点关注用户家庭位置、推文位置和提及位置的预测，并综述了当前各种策略的优点与缺点，同时也简要介绍了语义位置预测和兴趣点推荐两个相关问题。

May, 2017

使用统一的文本和网络预测模型进行 Twitter 用户地理位置推测

通过改进迭代算法并考虑基于文本的地理位置先验知识，我们提出了一种在社交媒体上进行地理位置预测的标签传播方法，实验证明该方法在三个 Twitter 基准数据集上取得了最优效果。

Jun, 2015

用户地理定位和词汇方言学的神经模型

本文提出了一个基于神经网络的简单且有效的基于文本的用户地理定位模型，其在三个 Twitter 基准地理定位数据集上实现了最先进的性能，并且在隐藏层中生成词和短语嵌入，我们展示了这些嵌入有助于检测方言术语。作为我们方言术语分析的一部分，我们发布了一个评估方言术语检测方法的 DAREDS 数据集。

Apr, 2017

BERT4Loc: 基于 BERT 的位置推荐系统

本研究提出了一个基于 BERT 的定位感知推荐系统，该系统可以从基于位置的社交媒体平台中提取位置信息，并根据用户的历史行为和偏好，为用户提供更相关的位置推荐结果，该模型在大量的实验数据集中一致优于现有的顺序模型。

Aug, 2022

地理标记 Twitter 数据中的混淆和后果

通过比较使用 GPS 坐标和用户自报位置不同的语言分析方法，研究表明不同年龄和性别的人对特定主题的写作风格有所不同，并给出了男性 40 岁以上的文本地理定位最准确的结果。同时，年龄和性别是影响语言使用的重要变量。

Jun, 2015

基于命名实体识别和主题建模的社交媒体中自然灾害定位和评估的解决方案

在这篇论文中，我们提出了一个三步解决方案，旨在充分利用社交媒体内容和自然语言处理技术，实现灾害信息学中的相关分类、地点提取和主题建模，以应对社交媒体内容中的挑战。

May, 2024