关键词systematic evaluation benchmark
搜索结果 - 2
  • CityBench: 评估大型语言模型作为世界模型的能力
    PDF17 days ago
  • 基于注释指南的知识增强:用于提升教育文本分类的大型语言模型
    PDFa month ago
Prev
Next