关键词evaluation tasks
搜索结果 - 12
- MLVU: 多任务长视频理解的全面基准PDFa month ago
- ACL评估大型语言模型的数学推理能力:重点关注错误识别和纠正PDFa month ago
- 评估和模拟社会智能:人类与人工智能能力的比较研究PDFa month ago
- 扩展 Llama-3 上下文十倍于一夜之间PDF2 months ago
- 评估中的生成 AI 悖论:它能解决的问题,可能无法评估PDF5 months ago
- ACL能否使用 NLP 模型 ' 识别 ',' 区分 ' 和' 证明 ' 没有明确答案的问题?PDF10 months ago
- 长颈鹿:在 LLM 中扩展上下文长度的探险PDF10 months ago
- 对大型语言模型评估的调查PDFa year ago
- CompanyKG:用于公司相似度计算的大规模异构图PDFa year ago
- 利用自然监督进行语言表示学习和生成PDF2 years ago
- ACL训练模型对视觉常识知识的学习PDF2 years ago
- 知识表示学习:量化评述PDF6 years ago
Prev
Next