Oct, 2024

CoPESD:用于训练大型视觉语言模型的多层次外科手术动作数据集,以协助内窥镜下粘膜下切除

TL;DR本研究解决了现有数据集中缺乏多层次精细运动理解的不足,提出了一个新的多层次外科手术动作数据集CoPESD,旨在为大规模视觉语言模型的训练提供支持。该数据集包含17,679张图像和88,395种多层次动作,能有效提升机器人辅助手术的精确性和减少风险,推动内窥镜下技术的自动化研究。