Jul, 2023

通过基于短时傅里叶变换机器学习在 Nvidia Edge GPU 设备上实施的声音和音频分类来检测儿童虐待

TL;DR通过机器学习应用于儿童保育机构,本研究的目的是检测儿童虐待场景,以提高儿童的安全性,通过对儿童的声音进行分类和识别,预测儿童当前发出的声音是哭泣、尖叫还是笑声,并实时向相关人员发送警报,通过同时使用视频图像分类的混合方式,可以显著提高儿童虐待侦测的准确性,减少幼儿园儿童受到暴力虐待的可能性,使工作人员能及时干预即将发生或刚刚开始的儿童虐待事件。在该实验中收集的数据集完全来自儿童保育机构现场录制的声音,包括哭泣声、笑声、尖叫声和背景噪音,这些声音文件使用短时傅里叶变换转换为频谱图,然后将这些图像数据导入到一个 CNN 神经网络进行分类,最终训练的模型在声音检测方面可以达到约 92% 的准确率。