评估大型语言模型在表示和理解运动轨迹方面的有效性

Aug, 2024

评估大型语言模型在表示和理解运动轨迹方面的有效性

Evaluating the Effectiveness of Large Language Models in Representing and Understanding Movement Trajectories

Yuhan Ji, Song Gao

TL;DR本研究旨在评估人工智能基础模型在运动轨迹表示中的能力，尤其是大型语言模型(GPT-J)在编码轨迹数据方面的有效性。研究结果表明，虽然LLM能够保持一些轨迹距离度量的相关性，但在恢复数值和检索空间邻域方面仍面临挑战，强调了对地理空间数据的细微差别的捕捉及领域知识的整合的重要性，以支持GeoAI应用。

Abstract

This research focuses on assessing the ability of AI foundation models in representing the trajectories of movements. We utilize one of the Large Language Models (LLMs) (i.e., GPT-J) to encode the string format of trajectories and then evaluate the effectiveness of the LLM-based repres

发现论文，激发创造

评估大型语言模型在几何和空间关系的文本描述中的有效性

研究使用大型语言模型（LLMs）对几何形状及其空间关系进行表示的能力，并使用GPT-2和BERT等LLMs对几何形状的文本（WKT）格式进行编码，然后将其嵌入分类器和回归器中评估LLMs生成的嵌入表示对几何属性的效果。实验证明，尽管LLMs生成的嵌入可以保留几何类型并捕捉一些空间关系（准确率高达73%），但在估计数值和检索空间相关对象方面仍存在挑战。此研究强调了在捕捉底层地理空间数据的细微差别和复杂性以及整合领域知识以支持各种基于GeoAI应用的需要改进的重要性。

Jul, 2023

大型语言模型作为人类移动预测器

本文介绍了利用大型语言模型（LLM）进行人类移动性预测的潜力。通过引入LLM-Mob方法，该研究提出了历史停留和上下文停留的概念，以捕捉人类移动性中的长期和短期依赖，并通过使用预测目标的时间信息实现时间感知预测。全面的评估结果表明，LLM-Mob在提供准确可解释预测方面表现出色，突显了LLM在推进人类移动性预测技术上的未开发潜力。

Aug, 2023

大型语言模型用于空间轨迹模式挖掘

通过对领先的大语言模型如GPT-4和Claude-2在检测移动数据中的异常行为的能力进行实证研究，我们的研究发现大语言模型可以在没有特定线索的情况下达到合理的异常检测性能，并且在提供上下文线索的情况下可以进一步提高预测效果，同时能够提供合理的判断解释，从而增加透明度，为人类空间轨迹分析的研究提供了洞察。

Oct, 2023

评估大型语言模型的空间理解能力

大型语言模型（LLMs）展现出在各种任务中的卓越能力。我们探索LLMs对于一种特别显著的基于实际距离的知识，即空间关系的表示。通过设计自然语言导航任务，我们评估了LLMs（特别是GPT-3.5-turbo，GPT-4和Llama2系列模型）在表示和推理空间结构方面的能力，并将这些能力与人类在相同任务上的表现进行比较。这些任务揭示了LLMs在不同空间结构（包括正方形、六边形和三角形网格、环和树形结构）中的表现变异性。我们还发现，类似于人类，LLMs利用对象名称作为地标来维护空间地图。最后，在广泛的错误分析中，我们发现LLMs的错误反映了空间和非空间因素。这些发现表明，LLMs似乎能够隐含地捕捉到空间结构的某些方面，但仍有改进空间。

Oct, 2023

探索和提升大型语言模型的空间推理能力

利用大型语言模型(大型语言模型)分析3D机器人轨迹数据和2D方向形状标注等任务，并引入基于前缀的提示机制，提高了性能，为未来的改进提供了基础。

Dec, 2023

您是否被追踪？了解LLMs的零射线轨迹追踪能力！

本研究介绍了 LLMTrack 模型，展示了如何利用大型语言模型（LLMs）通过采用一种独特的单提示技术，结合角色扮演和逐步思考方法，处理未经处理的惯性测量单元（IMU）数据，实现零通道轨迹识别。通过对真实世界数据集进行评估，我们发现在室内和室外场景中，LLMTrack 不仅达到了传统机器学习方法以及当代深度学习模型所设定的性能基准，甚至超过了这些基准，而且无需在特定数据集上进行训练。我们的研究结果表明，在经过精心设计的提示的指导下，LLMs 可以利用其丰富的知识库，以极高的效率分析原始传感器数据。

Mar, 2024

PLM4Traj：使用预训练语言模型识别轨迹的运动模式与旅行目的

通过利用预训练语言模型（PLM）建立一个名为PLM4Traj的模型，该模型能够适应不同任务，有效地提取出嵌入在轨迹中的运动模式和旅行目的，从而解决了原始PLMs在建模轨迹时的不足，为轨迹学习提供了通用的解决方案。

May, 2024

大型语言模型的零-shot 下一个位置预测模型

利用大型语言模型作为零样本下一个位置的预测器进行了评估，并展示了其较高的准确性和解释能力，为解决诸如疾病传播和减少污染等社会问题提供了一种新思路。

May, 2024

在空间任务上评估大型语言模型：多任务基准研究

本研究针对当前大型语言模型在空间任务上的评估缺乏进行深入探讨，提出了一套新颖的多任务空间评估数据集，系统比较多种模型的性能。研究发现，gpt-4o在总体准确度上表现最佳，而不同的提示策略对模型在特定任务的表现有显著影响，如COT策略在路径规划任务中将gpt-4o的准确率提升至87.5%。

Aug, 2024

评估大型语言模型在空间任务上的表现：一项多任务基准研究

本研究解决了大型语言模型在空间任务上评估不足的问题，介绍了一种新的多任务空间评估数据集，系统地探索和比较多种先进模型的表现。研究发现，gpt-4o在总体准确性上表现最佳，平均准确率为71.3%，而特定提示策略显著提高了模型在某些任务中的表现。

Aug, 2024