Oct, 2023

展示而非描述:临床场景中的音视建模

TL;DR本文介绍了一种在临床环境中的音频 - 视觉建模方法,提供了一种无需人工专家标注的学习医学表征的解决方案,通过只有语音音频作为参考,可以定位超声成像中感兴趣的解剖区域。在大规模临床多模式超声视频数据集上的实验评估表明,该自我监督方法学习到的良好可迁移的解剖表征可以提高自动化的下游临床任务的性能,甚至超过完全监督的解决方案。