BriefGPT.xyz
大模型
Ask
alpha
关键词
language-image
搜索结果 - 2
视觉指令调整
本文利用语言模型 GPT-4 生成多模态图文指令序列来优化多模态模型,得到了新的模型 LLaVA 并在多个数据集上表现出色。
PDF
a year ago
语言图像预训练的 Sigmoid Loss
本文提出了针对图像 - 文本预训练的简单对数损失函数,其中使用 sigmoid 函数,从而可以放大批量大小,并实现更好的性能表现。
PDF
a year ago
Prev
Next