BriefGPT.xyz
大模型
Ask
alpha
关键词
capability gap
搜索结果 - 2
填补视觉语言模型选择中的模态和容量差距
本文分析了在使用语言 - 仅依据进行视觉语义模型 (VLM) 选择中的两个固有挑战:模态差异和能力差异,并提出了一种称为 SWAB 的方法来缓解这两个差距,通过最优传输捕捉开源数据集与目标数据集之间的相关性,并将有用的统计信息从开源数据集传
→
PDF
3 months ago
MAgIC: 大型语言模型驱动的多智能体在认知、适应性、合理性和协作方面的基准测试
这项研究介绍了一个专门用于评估大型语言模型在多主体环境中能力的基准测试框架,通过游戏和博弈论场景来创建不同的测试环境,并利用概率图模型方法增强模型的导航能力,最终量化评估了七种不同大型语言模型的能力,发现最强模型 GPT-4 和最弱模型 L
→
PDF
8 months ago
Prev
Next