MyDigitalFootprint: 广泛上下文数据集,适用于边缘计算应用
本文介绍了一个框架,可收集来自个人移动设备的数据集,包含异构传感器数据,使用六种降维技术,可以在保持准确率损失小于 3% 的情况下,实现 10 倍加速和超过 90% 的特征减少,从而提高上下文分类能力。
Jun, 2023
描述了一个数据收集活动和由智能手机传感器得出的数据集,该数据集作为包含 45K 多个数据样本的 CSV 文件集合发布,每个样本由 1332 个与物理和虚拟传感器相关的特征组成,包括动作传感器、运行应用、附近设备和天气条件。此外,每个数据样本都与描述用户活动和传感实验中的情境(例如工作、就餐和运动活动)的基本真实标签相关联。为了避免引入数据收集过程中的任何偏差,我们在野外进行了传感实验,即使用志愿者的设备,并且没有限制用户行为。因此,收集的数据集对于定义和评估移动环境中根据用户情境变化调整行为的各种新颖背景感知解决方案(算法和协议)是一个有用的真实数据来源。
Jul, 2023
该论文提出了一种基于移动设备的无监督轻量级方法来直接模拟用户的社交上下文和位置,该方法利用了自我网络模型,对智能手机嵌入式传感器数据提取高级别的语义上下文特征,在社交上下文方面,该方法利用了在用户和设备之间的物理和网络社交互动的数据,对于位置,它优先建模了特定位置的熟悉度程度,相对于只使用与物理上下文相关的特征,该方法在 AUROC、Precision 和 Recall 方面的表现都有所提高。
Jun, 2023
本文利用 Social Graph API、FriendFeed 和 Profilactic 等工具提取了不同社交网络用户身份的信息,并生成了数字足迹。该文专注于推特和领英用户的自动分类,通过 UserID 和 Name 特征和相似度分析,实现了 98% 的准确性、99% 的精度和 96% 的召回率,从而解决了在多个社交网络上识别同一用户的问题。
Jan, 2013
本文提出了一种基于设备指纹技术的模型,能够在网络设备中区分物联网设备和非物联网设备,并能针对每个设备进行唯一识别,通过使用随机森林分类器和不同数据集的实验证明,该方法能够在分辨物联网和非物联网设备方面达到 99.8% 以上的准确率,并在分类个体设备方面达到 97.6% 以上的准确率,可有效帮助运营商提高网络安全性和防止未经授权的访问。
Jan, 2023
该研究总结了现代智能手机上常见的传感器,并提出了一个利用这些传感器模拟人与智能手机之间交互的维度分类法。其应用包括神经运动技能、认知功能和行为或例行程序,尤其关注用户认证方面的应用。通过使用人类移动交互的新型多模式数据库(HuMIdb 数据库),以深度学习中的连体神经网络为基础,该研究还检验了一个基于简单线性触摸手势的生物识别认证系统,达到了 87% 的准确率。
Jun, 2020
在线社交平台成功的关键在于它们能够以大规模预测和理解用户行为。我们展示了数据,表明上下文感知建模方法可能提供全面、轻量且可能保护隐私的在线社交平台用户参与表示。利用深度 LSTM 神经网络分析来自近 80,000 个用户的 1 亿多个 Snapchat 会话,我们证明了过去行为可以预测主动和被动使用的模式(R2=0.345),而与行为基线模型相比,整合上下文信息可以显著提高预测性能(R2=0.522)。与从应用内行为历史中提取的特征相比,与智能手机连接状态、位置、时间上下文和天气有关的特征被发现捕捉到了用户参与度中非冗余的变化。此外,我们还发现,如果考虑当时的上下文信息,大部分变化都可以用极简的行为历史来解释(R2=0.44)。这些结果表明,上下文感知方法有潜力通过减少对长期数据历史的需求来使模型更高效和保护隐私。最后,我们运用模型可解释性技术来初步了解潜在的行为机制。我们的发现与上下文相关、习惯驱动的主动和被动使用模式的概念一致,突显了上下文化用户行为表示对于预测社交平台用户参与的价值。
Oct, 2023
每日监测的紧迫性与重要性日益凸显,本研究提出了一种利用生理信号和环境信息的实时监测系统来追踪和预测每日压力水平的方法,并通过集成智能标签方法来优化压力检测的机器学习模型。实验结果显示,利用脉搏波图和环境信息结合的随机森林分类器,F1 得分可达到 70%,较仅使用脉搏波图的 56% 得分更为显著。
Dec, 2023
本文介绍了一份多年的被动监测数据集,用于支持进行跨数据集评估行为建模算法的泛化性能,并提供 18 种算法在抑郁症检测任务上的基准结果。结果表明,先前的抑郁症检测算法和领域泛化技术都有潜力但需要进一步研究才能实现充分的跨数据集泛化能力。
Nov, 2022
本文基于一份葡萄牙通讯数据集的 100,000 名匿名用户数据,探索了移动设备数据集中用户的社交网络、时间动态和移动通讯行为之间的联系,并通过聚类和主成分分析发现地理位置是影响人类行为的最重要因素之一。研究结果表明,通过聚类方法可以鲁棒地识别用户的家庭和办公室,并且其通勤距离可以通过引力模型进行合理地解释。
Nov, 2012