关键词bilingual benchmark
搜索结果 - 4
  • CUDRT:人类与大型语言模型生成文本的检测基准
    PDF21 days ago
  • ACLStatBot.Swiss: 双语自然语言下的开放数据探索
    PDFa month ago
  • ConceptMath:大型语言模型数学推理的双语概念评估基准
    PDF4 months ago
  • RoleEval:大型语言模型的双语角色评估基准
    PDF6 months ago
Prev
Next