关键词multi-modality foundation models
搜索结果 - 3
- OpenMEDLab:一个面向医学领域的开源多模态基础模型平台
OpenMEDLab 是一个开放源代码平台,用于多模态基础模型,它不仅集成了前沿临床和生物信息学应用的大型语言和视觉模型的解决方案,还利用大规模多模态医学数据构建领域特定的基础模型。该平台还提供了各种医学图像模态、临床文本和蛋白工程等领域的 - 跨模态去偏倚:利用语言减轻图像中的亚种群转变
本文通过利用多模态基础模型中的分布鲁棒性,通过参数微调来提高分布鲁棒性,并利用自然语言输入来消除图像特征中的偏见,从而在子群落变化下改善最坏情况性能。大量实证研究表明,通过自然语言进行去偏倚的图像表示能够显著提高性能,并降低在子群体变化下的 - Q-Instruct: 提升多模态基础模型的低层视觉能力
基于 GPT-4V 的多模态基础模型,在低级视觉感知和理解任务方面带来了新的范式,可以对多种自然人类指令做出响应。通过大规模的主观实验收集了大量关于低级视觉的真实人类反馈,建立了包含 58K 个详细反馈的 Q-Pathway 数据集,实验结