关键词evaluation tasks
搜索结果 - 12
  • MLVU: 多任务长视频理解的全面基准
    PDFa month ago
  • ACL评估大型语言模型的数学推理能力:重点关注错误识别和纠正
    PDFa month ago
  • 评估和模拟社会智能:人类与人工智能能力的比较研究
    PDFa month ago
  • 扩展 Llama-3 上下文十倍于一夜之间
    PDF2 months ago
  • 评估中的生成 AI 悖论:它能解决的问题,可能无法评估
    PDF5 months ago
  • ACL能否使用 NLP 模型 ' 识别 ',' 区分 ' 和' 证明 ' 没有明确答案的问题?
    PDF10 months ago
  • 长颈鹿:在 LLM 中扩展上下文长度的探险
    PDF10 months ago
  • 对大型语言模型评估的调查
    PDFa year ago
  • CompanyKG:用于公司相似度计算的大规模异构图
    PDFa year ago
  • 利用自然监督进行语言表示学习和生成
    PDF2 years ago
  • ACL训练模型对视觉常识知识的学习
    PDF2 years ago
  • 知识表示学习:量化评述
    PDF6 years ago
Prev
Next