Mar, 2024

CLIPSwarm:使用视觉语言模型从文本提示生成无人机表演

TL;DRCLIPSwarm是一种基于自然语言的自动建模蜂群无人机编队的算法,通过迭代方法找到与提供的词最匹配的编队,并通过CLIP编码来衡量描述和视觉表达之间的相似性,最后赋予机器人无碰撞运动的控制动作,实现更加有效的视觉表达,并展示了算法的多样性和准确地从自然语言描述中建模机器人编队的能力。