BriefGPT.xyz
Ask
alpha
关键词
question answering accuracy
搜索结果 - 2
使用 MultiQ 评估大型语言模型的基础多语言能力
研究表明,尽管当前大部分开放式语言模型主要面向英语或少数几种高资源语言,人们却在多种语言中使用这些模型。本文通过引入 MultiQ 标准测试并评估 27.4k 个不同语言的基本开放式问答问题,探讨了现有开放式语言模型在超越其预定用途方面的多
→
PDF
4 months ago
探索多模态大型语言模型的感知限制
在多模态大型语言模型中,研究了其对小型视觉对象的感知限制,发现对象质量、大小、干扰物的位置等因素都会显著降低模型对视觉问题的回答准确性。该研究对多模态大型语言模型的感知限制进行了探索,为未来模型的感知分析提供了新的评价协议。
PDF
5 months ago
Prev
Next