GLOBEM 数据集:用于纵向人类行为建模泛化的多年数据集
研究使用可穿戴和环境传感器分析医院工作人员的工作表现,人际交往和幸福感,收集 212 名参与者的生理和行为数据,并通过测量个性特征,行为状态,工作表现和幸福感等问题,构建数据集,支持多模态行为建模、生物特征认证和隐私保护机器学习等应用
Mar, 2020
本文提出了一种使用多个数据集结合模型集成方法,并将其应用于压力检测的方法,该方法的表现优于仅基于单个小数据集训练的模型。
Sep, 2022
使用大型语言模型(LLMs)综合多传感器数据生成临床有用的洞察力,首次展示使用 LLMs 进行二元抑郁症分类的准确性超过了现有技术,而且还强调了人工智能与医生领域专业知识和患者背景相结合的人工智能协同方法在临床决策支持方面的价值。
Nov, 2023
描述了一个数据收集活动和由智能手机传感器得出的数据集,该数据集作为包含 45K 多个数据样本的 CSV 文件集合发布,每个样本由 1332 个与物理和虚拟传感器相关的特征组成,包括动作传感器、运行应用、附近设备和天气条件。此外,每个数据样本都与描述用户活动和传感实验中的情境(例如工作、就餐和运动活动)的基本真实标签相关联。为了避免引入数据收集过程中的任何偏差,我们在野外进行了传感实验,即使用志愿者的设备,并且没有限制用户行为。因此,收集的数据集对于定义和评估移动环境中根据用户情境变化调整行为的各种新颖背景感知解决方案(算法和协议)是一个有用的真实数据来源。
Jul, 2023
为了支持机器学习方法在预测时间序列数据方面的进展,我们提供了一个专门设计用于长期时间序列预测的全面数据集。我们将从不同的动态系统和真实记录中获取的一系列数据集进行了标准化,每个数据集都被分成了训练和测试轨迹,并设定了预定的回溯长度。通过对经典和先进的模型(即 LSTM,DeepAR,NLinear,N-Hits,PatchTST,和 LatentODE)进行广泛的基准分析,我们确定在不同场景中最有效的模型。我们的研究结果显示出这些模型之间有着有趣的性能比较,突显了模型效果与数据集有关的特性。值得注意的是,我们引入了一个定制的 latent NLinear 模型并且通过课程学习阶段提高了 DeepAR 的性能,它们在效果上始终优于其原始版本。
Sep, 2023
本研究利用深度学习直接对原始手机元数据建模,通过时间模式预测用户的基本人口统计信息,包括年龄和性别,并通过对模型假设的验证,获得了最先进的预测准确性。
Nov, 2015
通过对高自杀风险人群进行研究,本文从语言和移动文本的多模态表示等方面分析了手机使用行为与情绪的关联,并提出一种保护隐私的深度学习方法来提高智能手机数据的使用价值。
Jun, 2021
评估跨文化 Twitter 数据对建立跨文化 AI 模型的泛化性,结果显示抑郁症检测模型在全球化方面表现较差,特别是在全球南方用户中,预训练语言模型在泛化性方面表现最佳,但在抑郁和非西方用户的表现仍存在差距。我们对发现进行量化,并提供了一些建议来缓解此问题。
Apr, 2024
本研究提出一种多模态深度学习模型,结合了转换器编码器和预训练语言模型,利用客观指标和自我报告日记进行情感状态预测。通过进行为期一年的纵向研究,监测大学生参与者的身体、环境、睡眠、新陈代谢和体力活动参数,以及开放式的文本日记,实证结果表明该模型在提前一周预测积极和消极情感方面的准确率分别为 82.50% 和 82.76%。该模型的解释性进一步提高了其有效性。
Mar, 2024