Jun, 2024

Yo'LLaVA: 个性化语言和视觉助手

TL;DR本文介绍了将个性化主题嵌入到一组潜在令牌中的 Yo'LLaVA 方法,通过少量示例图像有效地学习并更有效地编码视觉属性,用于实现 Large Multimodal Models(LMMs)与特定主题的对话。