Sep, 2024

MiniVLN:通过渐进知识蒸馏实现高效的视觉与语言导航

TL;DR本研究解决了智能体人工智能平台中模型庞大与计算能力有限之间的矛盾,专注于视觉与语言导航任务。提出的双阶段知识蒸馏框架有效捕捉了细粒度知识和导航特定知识,使得MiniVLN在参数量仅为教师模型12%的情况下,与教师模型的性能持平,展现了轻量级模型的巨大潜力。