BriefGPT.xyz
Ask
alpha
关键词
visual instruction data
搜索结果 - 2
STLLaVA-Med:医学领域的自我训练大型语言与视觉助理
通过引入自我训练的大型语言和视觉助手 (STLLaVA-Med),使用 LVLM 和直接优化原则 (DPO) 自动产生医学视觉指导数据,以提高数据效率,并且证实了在使用只有 9% 的医学数据的情况下,STLLaVA-Med 在三个主要的医学
→
PDF
8 days ago
MM-Instruct: 大型多模态模型对齐的生成视觉指令
该研究介绍了 MM-Instruct,这是一个大规模、多样化和高质量的视觉指导数据集,旨在增强大型多模态模型(LMMs)的指令跟随能力,并通过使用现有的 LLMs 从大规模图像字幕数据集生成新的视觉指导数据,并介绍了一个基于生成的指导数据来
→
PDF
8 days ago
Prev
Next