Jul, 2022

多任务演讲者关键词分类模型,用于保持人在无人机辅助巡检的循环中

TL;DR该研究旨在构建一种具有共享分裂协作结构的多任务深度学习模型,用于通过音频命令,对半自主无人机进行民用基础设施检查,该模型可以分类任何授权检查员的关键词,并在说话者分类方面取得了 99.2%的平均准确度。同时,该论文还探讨了该模型在人机交互中的应用价值。