BriefGPT.xyz
大模型
Ask
alpha
关键词
vlue benchmark
搜索结果 - 2
ACL
VLUE:越南自然语言理解的新基准和多任务知识迁移学习
为了评估新的自然语言理解模型在一系列任务上的表现,我们引入了第一个越南语语言理解评估(VLUE)基准,涵盖了五个不同的 NLU 任务,包括文本分类、跨度提取和自然语言理解。我们评估了七个最先进的预训练模型在我们提出的 VLUE 基准上的表现
→
PDF
3 months ago
ICML
VLUE: 一个评估视觉语言模型的多任务基准
本研究介绍了一个名为 VLUE 的视觉语言理解评估基准,可用于评估 VLP 模型的泛化能力和效率 - 性能权衡。该基准显示了所有 VLP 模型在处理来自更多文化领域且未在预训练中出现的图像时存在较大的泛化差距,并且衡量 VLP 模型的效率
→
PDF
2 years ago
Prev
Next