BriefGPT.xyz
Ask
alpha
关键词
audio-visual sound event localization and detection
搜索结果 - 1
增强的 360 度实际音频 - 视觉声景中的声音事件定位和检测
该技术报告详细介绍了我们构建增强的音频 - 视觉声音事件定位和检测(SELD)网络的工作。我们在音频 - 视觉数据前对音频 - 专有网络的门控循环单元(GRU)之前合并音频和视频信息。我们的模型利用 YOLO 和 DETIC 目标检测器。我
→
PDF
5 months ago
Prev
Next