BriefGPT.xyz
Ask
alpha
关键词
multimodal interactive systems
搜索结果 - 2
MAGID: 生成合成多模态数据集的自动化流程
我们引入了 MAGID,一个以多模式互动系统为基础的创新框架,通过高质量且多样化的图像增强了仅有文本的对话,通过扩充图像数据库取得显著的人类评估改进。
PDF
4 months ago
LLaVA-Interactive: 图像聊天、分割、生成和编辑的一体化演示
LLaVA-Interactive 是一种用于多模态人工智能交互的研究原型系统,其能够通过获取多模态用户输入和生成多模态响应与用户进行多轮对话。该系统具有可视化提示功能,以对齐人类意图,同时还结合了 LLaVA 的可视化聊天、SEEM 的图
→
PDF
8 months ago
Prev
Next