GLOBEM 数据集：用于纵向人类行为建模泛化的多年数据集

Nov, 2022

GLOBEM 数据集：用于纵向人类行为建模泛化的多年数据集

GLOBEM Dataset: Multi-Year Datasets for Longitudinal Human Behavior Modeling Generalization

Xuhai Xu, Han Zhang, Yasaman Sefidgar, Yiyi Ren, Xin Liu...

TL;DR本文介绍了一份多年的被动监测数据集，用于支持进行跨数据集评估行为建模算法的泛化性能，并提供 18 种算法在抑郁症检测任务上的基准结果。结果表明，先前的抑郁症检测算法和领域泛化技术都有潜力但需要进一步研究才能实现充分的跨数据集泛化能力。

Abstract

Recent research has demonstrated the capability of behavior signals captured by smartphones and wearables for longitudinal behavior modeling

behavior modeling smartphones wearables multi-year dataset depression detection

发现论文，激发创造

TILES-2018，一份医院工作人员生理和行为数据的纵向数据集

研究使用可穿戴和环境传感器分析医院工作人员的工作表现，人际交往和幸福感，收集 212 名参与者的生理和行为数据，并通过测量个性特征，行为状态，工作表现和幸福感等问题，构建数据集，支持多模态行为建模、生物特征认证和隐私保护机器学习等应用

Mar, 2020

基于新合成数据集训练的集成机器学习模型在使用可穿戴设备进行压力预测时具有良好的泛化能力

本文提出了一种使用多个数据集结合模型集成方法，并将其应用于压力检测的方法，该方法的表现优于仅基于单个小数据集训练的模型。

Sep, 2022

从分类到临床洞见：用大型语言模型分析和推理移动和行为健康数据

使用大型语言模型（LLMs）综合多传感器数据生成临床有用的洞察力，首次展示使用 LLMs 进行二元抑郁症分类的准确性超过了现有技术，而且还强调了人工智能与医生领域专业知识和患者背景相结合的人工智能协同方法在临床决策支持方面的价值。

Nov, 2023

ContextLabeler 数据集：野外手机使用中收集的物理和虚拟传感器数据

描述了一个数据收集活动和由智能手机传感器得出的数据集，该数据集作为包含 45K 多个数据样本的 CSV 文件集合发布，每个样本由 1332 个与物理和虚拟传感器相关的特征组成，包括动作传感器、运行应用、附近设备和天气条件。此外，每个数据样本都与描述用户活动和传感实验中的情境（例如工作、就餐和运动活动）的基本真实标签相关联。为了避免引入数据收集过程中的任何偏差，我们在野外进行了传感实验，即使用志愿者的设备，并且没有限制用户行为。因此，收集的数据集对于定义和评估移动环境中根据用户情境变化调整行为的各种新颖背景感知解决方案（算法和协议）是一个有用的真实数据来源。

Jul, 2023

统一长期时间序列预测基准

为了支持机器学习方法在预测时间序列数据方面的进展，我们提供了一个专门设计用于长期时间序列预测的全面数据集。我们将从不同的动态系统和真实记录中获取的一系列数据集进行了标准化，每个数据集都被分成了训练和测试轨迹，并设定了预定的回溯长度。通过对经典和先进的模型（即 LSTM，DeepAR，NLinear，N-Hits，PatchTST，和 LatentODE）进行广泛的基准分析，我们确定在不同场景中最有效的模型。我们的研究结果显示出这些模型之间有着有趣的性能比较，突显了模型效果与数据集有关的特性。值得注意的是，我们引入了一个定制的 latent NLinear 模型并且通过课程学习阶段提高了 DeepAR 的性能，它们在效果上始终优于其原始版本。

Sep, 2023

建模人类行为的时间特性以预测人口统计信息

本研究利用深度学习直接对原始手机元数据建模，通过时间模式预测用户的基本人口统计信息，包括年龄和性别，并通过对模型假设的验证，获得了最先进的预测准确性。

Nov, 2015

从移动数据中学习语言和多模态隐私保护的情绪标记

通过对高自杀风险人群进行研究，本文从语言和移动文本的多模态表示等方面分析了手机使用行为与情绪的关联，并提出一种保护隐私的深度学习方法来提高智能手机数据的使用价值。

Jun, 2021

多元观点，分歧模型：跨文化评估 Twitter 上的抑郁检测

评估跨文化 Twitter 数据对建立跨文化 AI 模型的泛化性，结果显示抑郁症检测模型在全球化方面表现较差，特别是在全球南方用户中，预训练语言模型在泛化性方面表现最佳，但在抑郁和非西方用户的表现仍存在差距。我们对发现进行量化，并提供了一些建议来缓解此问题。

Apr, 2024

自然时间序列移动活动识别下行为和时间变化的域自适应

通过采集数据集，支持在自然场景下进行移动活动识别和健康监测，使用无监督领域适应算法和对比学习来提高识别准确性，数据集可供使用。

Jul, 2022

整合可穿戴传感器数据和自报日记以进行个性化情绪预测

本研究提出一种多模态深度学习模型，结合了转换器编码器和预训练语言模型，利用客观指标和自我报告日记进行情感状态预测。通过进行为期一年的纵向研究，监测大学生参与者的身体、环境、睡眠、新陈代谢和体力活动参数，以及开放式的文本日记，实证结果表明该模型在提前一周预测积极和消极情感方面的准确率分别为 82.50% 和 82.76%。该模型的解释性进一步提高了其有效性。

Mar, 2024