关键词matt benchmark
搜索结果 - 1
  • LLM 不是智能思考者:引入数学主题树基准评估来全面评估 LLMs
    PDFa month ago
Prev
Next