人工 ASMR:一项网络心理研究
比较自动环境声音识别算法在计算成本方面的表现,结果表明在一定的计算成本范围内,深度神经网络能够提供最好的声音分类准确性比率,而高斯混合模型可以以相对较小的成本提供合理的准确性,支持向量机则在准确性和计算成本之间做了妥协。
Jul, 2016
自动语音识别是我们日常生活中的关键技术之一,本文章综述了在基于人工耳蜗的语音合成和增强领域中,应用人工智能方法以解决语音失真等问题的最新进展,并提出了未来研究方向。
Mar, 2024
本文研究了使用神经自动语音识别(ASR)作为情感识别的特征提取器,在预测色调和唤起情绪维度方面,这些特征优于 eGeMAPS 特征集。我们还研究了 ASR 的第一层和最后一层与 valence/arousal 之间的关系。
May, 2018
通过对最近的文献进行综合性、系统性的回顾和荟萃分析,本研究旨在分析使用人工智能进行的睡眠研究中不同方法和其结果,包括睡眠阶段分类和睡眠障碍检测。
May, 2024
通过对真实和伪造音频进行研究,发现最先进的深度伪造音频检测算法所学习的表示并不表现出真伪音频之间明显的不同模式,相反,通过脑电图测量可观察到人类在接触伪造音频和真实音频时的不同模式,这为深度伪造音频检测等领域的未来研究方向提供了初步证据。
Feb, 2024
本文介绍了如何使用图像识别中的归因方法,结合音频数据,帮助可视化深度神经网络自动语音识别模型中输入的哪些特征对输出结果影响最大。通过比较 Layer-wise Relevance Propagation(LRP)、Saliency Maps 和 Shapley Additive Explanations(SHAP)这三种可视化技术,展示了归因方法的优势和应用前景,包括在检测对抗性样本方面。
Feb, 2022
通过神经网络的层级表达,在多个任务中评估自动语音识别声学模型的性能变化和目标任务,我们可以推测哪些信息在不同层次的架构步骤中得到强化或干扰。分析结果显示,基于神经网络的声学模型拥有异质信息,似乎与音素识别没有相关性,例如情感、情绪或说话人身份,而低层隐藏层总体上对信息结构有用,而上层则倾向于删除对音素识别无用的信息。
Feb, 2024
通过比较不同程度的噪音对生理唤醒分类问题分类模型的影响,该研究探讨了为什么和如何以前的方法失败,并分析了噪音对每个模型结构的影响,从而开发出对噪音环境具有鲁棒性的模型,适合于日常生活的喧嚣。
Jun, 2023