BriefGPT.xyz
大模型
Ask
alpha
关键词
vision-language dataset
搜索结果 - 3
ChartInstruct: 图表理解和推理的指导调优
通过引入 ChartInstruct 数据集和两种不同的系统,我们展示了一种针对图表相关任务的指令调节方法,提供了广泛适用性和高效性。
PDF
4 months ago
Quilt-1M:组织病理学的一百万张图像文本配对
通过从 YouTube 等多种资源中收集图像和文本,我们构建了一个大规模的视觉语言数据集 Quilt-1M,其中共包含 100 万个成对的图像和文本样本,这是到目前为止规模最大的组织学图像和文本数据集,并通过微调预训练的 CLIP 模型在
→
PDF
a year ago
ACL
GEM: 多模态任务通用评估基准
本文介绍了一个新的多模态任务的通用评估基准 GEM,它是一个大规模的视觉 - 语言基准,由包括图像 - 语言任务和视频 - 语言任务的 GEM-I 和 GEM-V 组成,并标记有多种语言的数据集。我们还为此基准提供了两个基准模型,旨在推动多
→
PDF
3 years ago
Prev
Next