Jun, 2023

ViNT: 视觉导航的基础模型

TL;DR本文介绍了使用 ViNT 作为基础模型来解决基于视觉的机器人导航问题,并通过灵活的 Transformer 架构提高了 ViNT 在不同任务中的适应性和迁移性能,同时允许其与由 GPS 路径或路线指令等嵌入式任务模式进行编码的目标编码器进行相互替换。