ICMLMay, 2024
利用人工智能辅助策略优化标注预算的野外录音数据集创建实务方面的问题
Practical aspects for the creation of an audio dataset from field recordings with optimized labeling budget with AI-assisted strategy
Javier Naranjo-Alcazar, Jordi Grau-Haro, Ruben Ribes-Serrano, Pedro Zuccarello
TL;DR机器听觉的研究聚焦于开发从音频信号中提取相关信息的技术,本文强调了在获取和标注具有上下文的数据方面的重要性,提出了一种综合的数据中心框架用于机器听觉项目,在资源受限的情况下实现配置录音节点、数据库结构和标注预算优化,通过使用专家标注员而非众包实现主动学习,以解决处理大规模、不断增长的数据集带来的计算资源和内存限制等问题。