评估大型语言模型作为时间序列物理感测数据的虚拟标注器

Mar, 2024

评估大型语言模型作为时间序列物理感测数据的虚拟标注器

Evaluating Large Language Models as Virtual Annotators for Time-series Physical Sensing Data

Aritra Hota, Soumyajit Chatterjee, Sandip Chakraborty

TL;DR传统的基于人机协同的时间序列数据标注方法常常需要访问环境中的其他模态，例如视频或音频，以便为人类标注员提供必要的信息，因为原始数字数据常常对专家来说过于模糊。然而，这种传统方法在成本、效率、存储额外模态、时间、可扩展性和隐私等方面存在诸多问题。通过近期的大型语言模型（LLMs）的训练，这些模型还可以理解并在自然语言处理之外的任务上表现出色，这为将 LLMs 作为虚拟标注员进行探索开辟了潜在途径，其中 LLMs 将直接为标注提供原始传感器数据，而无需依赖任何其他模态。这自然地可以缓解传统的人机协同方法所面临的问题。受这一观察的启发，我们在本文中进行了一项详细研究，以评估最先进的 LLMs 是否可用作对时间序列物理感知数据进行标注的虚拟标注员。为了以系统的方式进行，我们将研究分为两个主要阶段。在第一阶段中，我们研究了 LLM（如 GPT-4）在理解原始传感器数据方面所面临的挑战。考虑到第一阶段的观察结果，在接下来的阶段中，我们研究了使用最先进的 SSL 方法对原始传感器数据进行编码的可能性，并利用映射后的时间序列数据从 LLM 获取标注。使用四个基准 HAR 数据集进行详细评估表明，基于 SSL 的编码和度量指导能够使 LLM 做出更合理的决策，并提供准确的标注，而无需进行计算昂贵的微调或复杂的提示工程。

Abstract

Traditional human-in-the-loop-based annotation for time-series data like inertial data often requires access to alternate modalities like video or audio from the environment. These alternate sources provide the n

human-in-the-loop time-series data large language models virtual annotators ssl-based encoding

发现论文，激发创造

大型语言模型用于时间序列的研究概述

该综述论文详细探讨了利用大型语言模型进行时间序列分析的各种方法，包括直接提示、时间序列量化、对齐技术、利用视觉作为桥梁机制以及与其他工具的结合，同时提供了现有的多模态时间序列和文本数据集的综合概述，并分析了该新兴领域的挑战和未来机会。

Feb, 2024

利用大规模语言模型增强时间序列分析：综述

对利用大型语言模型（LLMs）进行时间序列分析的现有方法进行了系统概述，总结了基于 LLM 的时间序列分析的一般流程，并探讨了未来的研究机会。

Feb, 2024

数据标注的大型语言模型调查

数据标注是提高机器学习模型效果的标记或标签化原始数据的过程，使用大型语言模型（LLMs）可以革新和自动化数据标注过程。本研究着重于 LLM 在数据标注中的特定用途，探讨了 LLM 基于数据标注、评估 LLM 生成的标注以及使用 LLM 生成的标注进行学习的方法。此外，还提供了 LLM 在数据标注中的方法学分类、包含 LLM 生成标注的模型的学习策略综述，并详细讨论了使用 LLM 进行数据标注所面临的主要挑战和限制。本文旨在为研究人员和从业者指导利用最新的 LLMs 进行数据标注，推动该关键领域的未来发展。

Feb, 2024

大型语言模型作为金融数据注释工具的效果与效率研究

研究通过比较三种大型语言模型与专家标注者和众包工人标注的金融文档，发现大型语言模型可作为提取金融文档中关系的高效数据标注工具，并引入了一个可靠性指标用于识别需要专家关注的输出，提供了在特定领域设置中自动化注释的收集和使用的建议。

Mar, 2024

使用公共社交媒体数据评估大型语言模型在健康相关文本分类任务中的性能

我们评估了多种模型，包括传统机器学习模型、预训练语言模型和大型语言模型，比较它们在社交媒体健康相关自然语言处理任务中的性能。实验结果表明，使用大型语言模型进行数据增强可以获得比仅使用人工标注数据训练的模型更好的结果，并且传统的有监督学习模型在零样本设置中也表现出优于大型语言模型的性能。

Mar, 2024

LLMs 作为标注者的有效性：直接表征的比较概述和实证分析

通过比较概述了 12 个研究探索了大型语言模型在数据标注方面的潜力，同时揭示了存在的限制，如表征性、偏见、对提示变化的敏感性和对英语的偏好。利用这些研究的见解，我们的实证分析在四个主观数据集上进一步检查了人类和生成的 GPT 意见分布之间的一致性，从而支持了少数研究在评估数据标注任务时考虑多元化观点的方法，并强调了在这个方向上进一步研究的必要性。

May, 2024

大型语言模型记忆传感器数据集！对人类活动识别研究的影响

调查证实了大型语言模型在人体活动识别中可能通过训练中接触到传感器数据，可能对实验评估结果产生重要影响。

Jun, 2024

循环中的 LLM：利用大型语言模型注释在低资源语言中进行主动学习

通过在主动学习环路中利用 LLM 的潜力进行数据标注，我们的提议在极低的数据需求下显著提高了性能，为低资源环境中的自动化带来了巨大的潜在成本节约。这种方法能够弥合低资源语言和人工智能之间的鸿沟，促进更广泛的包容，并有潜力在不同的语言环境中实现自动化。

Apr, 2024

利用大型语言模型为主题元数据添加注释：澳大利亚国家研究数据目录的案例研究

本文介绍了一种基于大型语言模型的上下文学习方法，通过 GPT-3.5 和为主题元数据注释设计的提示，实现了自动元数据注释，在一些类别中表现出有前景的性能。

Oct, 2023

起步最困难：大规模语言模型对于时间数据的表示和分词的陷阱

介绍了大型语言模型（LLMs）在移动健康感知等人类中心任务中的使用，并通过案例研究证明了目前流行的 LLMs 对于时间数据的分词处理存在错误，提出了解决方案如轻量级嵌入层调整和多模态适配器来弥合模态差异。该论文强调了语言模型在处理输入细微差别时无法产生有意义的输出。

Sep, 2023