婴儿啼哭的弱监督检测
本文探讨了自我监督学习(SSL)在分析超过一千名新生儿的临床指示下的呜 cries 数据库方面的应用,其中包括神经损伤的 cry 检测以及疼痛、饥饿和不适的 cry 触发器的识别。通过使用大量的无标签音频数据进行预训练和 SSL 对比损失(SimCLR)进行预训练,我们表明其在神经损伤和 cry 触发器方面都比监督式预训练有更好的表现。此外,我们还通过使用未标记的婴儿 cry 进行基于 SSL 的域自适应,进一步提高了性能,并减少了整个系统所需的标记数据。
May, 2023
通过机器学习应用于儿童保育机构,本研究的目的是检测儿童虐待场景,以提高儿童的安全性,通过对儿童的声音进行分类和识别,预测儿童当前发出的声音是哭泣、尖叫还是笑声,并实时向相关人员发送警报,通过同时使用视频图像分类的混合方式,可以显著提高儿童虐待侦测的准确性,减少幼儿园儿童受到暴力虐待的可能性,使工作人员能及时干预即将发生或刚刚开始的儿童虐待事件。在该实验中收集的数据集完全来自儿童保育机构现场录制的声音,包括哭泣声、笑声、尖叫声和背景噪音,这些声音文件使用短时傅里叶变换转换为频谱图,然后将这些图像数据导入到一个 CNN 神经网络进行分类,最终训练的模型在声音检测方面可以达到约 92% 的准确率。
Jul, 2023
我们提出了一种弱监督的异常检测系统,包括一个随机批处理选择机制、一个正常区域抑制块和一个聚类损失块,以利用训练批次中的总体信息,降低标签噪声并提高特征表示学习,以及通过三个数据集的实验证明了我们方法的卓越的异常检测能力。
Mar, 2022
该论文提出了一种轻量级视频异常检测模型,通过采用自适应实例选择策略和轻量级多级时间相关注意力模块,减少了模型参数,提高了模型性能,可在资源受限的情况下进行广泛部署。
Oct, 2023
描述了 Ubenwa CryCeleb 数据集 —— 一个标注的婴儿哭声集合,以及 CryCeleb 2023 任务 —— 一个基于婴儿哭声的公共说话者验证挑战。我们发布了超过 6 小时手动分割的 786 个新生儿的哭声,以鼓励婴儿哭声分析的研究。
May, 2023
本文提出了一种弱监督异常检测方法,该方法包括基于随机批量的训练过程、正常状态抑制机制、聚类距离损失等贡献,其中通过将模型生成的不同的正常和异常聚类,降低标签噪音并生成更好的异常表示。该方法在 UCF Crime 和 ShanghaiTech 数据集上获得了 83.03% 和 89.67% 的逐帧 AUC 性能,证明了其优于现有先进算法的优越性。
Nov, 2020
为了减少重症监护室中的假警报,采用一种新的多任务网络结构,利用远程监督的方法通过多个相关辅助任务来降低训练所需标签的数量,并证明我们的方法在实际数据集上优于多种现有工作。
Feb, 2018