评估大型语言模型在表示和理解运动轨迹方面的有效性
研究使用大型语言模型(LLMs)对几何形状及其空间关系进行表示的能力,并使用GPT-2和BERT等LLMs对几何形状的文本(WKT)格式进行编码,然后将其嵌入分类器和回归器中评估LLMs生成的嵌入表示对几何属性的效果。实验证明,尽管LLMs生成的嵌入可以保留几何类型并捕捉一些空间关系(准确率高达73%),但在估计数值和检索空间相关对象方面仍存在挑战。此研究强调了在捕捉底层地理空间数据的细微差别和复杂性以及整合领域知识以支持各种基于GeoAI应用的需要改进的重要性。
Jul, 2023
本文介绍了利用大型语言模型(LLM)进行人类移动性预测的潜力。通过引入LLM-Mob方法,该研究提出了历史停留和上下文停留的概念,以捕捉人类移动性中的长期和短期依赖,并通过使用预测目标的时间信息实现时间感知预测。全面的评估结果表明,LLM-Mob在提供准确可解释预测方面表现出色,突显了LLM在推进人类移动性预测技术上的未开发潜力。
Aug, 2023
通过对领先的大语言模型如GPT-4和Claude-2在检测移动数据中的异常行为的能力进行实证研究,我们的研究发现大语言模型可以在没有特定线索的情况下达到合理的异常检测性能,并且在提供上下文线索的情况下可以进一步提高预测效果,同时能够提供合理的判断解释,从而增加透明度,为人类空间轨迹分析的研究提供了洞察。
Oct, 2023
大型语言模型(LLMs)展现出在各种任务中的卓越能力。我们探索LLMs对于一种特别显著的基于实际距离的知识,即空间关系的表示。通过设计自然语言导航任务,我们评估了LLMs(特别是GPT-3.5-turbo,GPT-4和Llama2系列模型)在表示和推理空间结构方面的能力,并将这些能力与人类在相同任务上的表现进行比较。这些任务揭示了LLMs在不同空间结构(包括正方形、六边形和三角形网格、环和树形结构)中的表现变异性。我们还发现,类似于人类,LLMs利用对象名称作为地标来维护空间地图。最后,在广泛的错误分析中,我们发现LLMs的错误反映了空间和非空间因素。这些发现表明,LLMs似乎能够隐含地捕捉到空间结构的某些方面,但仍有改进空间。
Oct, 2023
本研究介绍了 LLMTrack 模型,展示了如何利用大型语言模型(LLMs)通过采用一种独特的单提示技术,结合角色扮演和逐步思考方法,处理未经处理的惯性测量单元(IMU)数据,实现零通道轨迹识别。通过对真实世界数据集进行评估,我们发现在室内和室外场景中,LLMTrack 不仅达到了传统机器学习方法以及当代深度学习模型所设定的性能基准,甚至超过了这些基准,而且无需在特定数据集上进行训练。我们的研究结果表明,在经过精心设计的提示的指导下,LLMs 可以利用其丰富的知识库,以极高的效率分析原始传感器数据。
Mar, 2024
通过利用预训练语言模型(PLM)建立一个名为PLM4Traj的模型,该模型能够适应不同任务,有效地提取出嵌入在轨迹中的运动模式和旅行目的,从而解决了原始PLMs在建模轨迹时的不足,为轨迹学习提供了通用的解决方案。
May, 2024
利用大型语言模型作为零样本下一个位置的预测器进行了评估,并展示了其较高的准确性和解释能力,为解决诸如疾病传播和减少污染等社会问题提供了一种新思路。
May, 2024
本研究针对当前大型语言模型在空间任务上的评估缺乏进行深入探讨,提出了一套新颖的多任务空间评估数据集,系统比较多种模型的性能。研究发现,gpt-4o在总体准确度上表现最佳,而不同的提示策略对模型在特定任务的表现有显著影响,如COT策略在路径规划任务中将gpt-4o的准确率提升至87.5%。
Aug, 2024
本研究解决了大型语言模型在空间任务上评估不足的问题,介绍了一种新的多任务空间评估数据集,系统地探索和比较多种先进模型的表现。研究发现,gpt-4o在总体准确性上表现最佳,平均准确率为71.3%,而特定提示策略显著提高了模型在某些任务中的表现。
Aug, 2024