Jun, 2024
多模态声道建模的分割
Multimodal Segmentation for Vocal Tract Modeling
Rishi Jain, Bohan Yu, Peter Wu, Tejas Prabhune, Gopala Anumanchipalli
TL;DR利用实时磁共振成像技术进行声道建模时的挑战和解决方案,通过视觉分割和多模态算法提高 MR 图像中声道部分的分割准确性,并释放了一个包含 75 个说话人的 RT-MRI 数据集的标注,增加了 9 倍以上的公共 RT-MRI 声道数据数量。