BriefGPT.xyz
Ask
alpha
关键词
multimodal human-ai interaction
搜索结果 - 1
LLaVA-Interactive: 图像聊天、分割、生成和编辑的一体化演示
LLaVA-Interactive 是一种用于多模态人工智能交互的研究原型系统,其能够通过获取多模态用户输入和生成多模态响应与用户进行多轮对话。该系统具有可视化提示功能,以对齐人类意图,同时还结合了 LLaVA 的可视化聊天、SEEM 的图
→
PDF
8 months ago
Prev
Next