关键词multi-task benchmark
搜索结果 - 6
  • CrossIn:一种跨语言知识对齐的高效指导优化方法
    PDF3 months ago
  • ACLSTORYWARS:协作式故事理解和生成的数据集和指导调优基线
    PDFa year ago
  • READIN:一个包含真实和多样化输入噪音的中文多任务基准
    PDFa year ago
  • ACLNumGLUE:一套基本而具有挑战性的数学推理任务
    PDF2 years ago
  • ACLGLGE:一个新的通用的自然语言生成评估基准
    PDF4 years ago
  • KLEJ: 波兰语言理解的全面基准
    PDF4 years ago
Prev
Next