Aug, 2024

SurGen:用于外科手术视频生成的文本引导扩散模型

TL;DR本研究解决了外科手术视频生成中缺乏真实感和交互性的挑战,提出了一种新的文本引导扩散模型SurGen。该模型能够生成最高分辨率和最长时长的手术视频,验证了其在视觉和时间质量上的优越性,为外科医师培训提供了有潜力的教育工具。