关键词multi-task benchmark
搜索结果 - 6
- CrossIn:一种跨语言知识对齐的高效指导优化方法PDF3 months ago
- ACLSTORYWARS:协作式故事理解和生成的数据集和指导调优基线PDFa year ago
- READIN:一个包含真实和多样化输入噪音的中文多任务基准PDFa year ago
- ACLNumGLUE:一套基本而具有挑战性的数学推理任务PDF2 years ago
- ACLGLGE:一个新的通用的自然语言生成评估基准PDF4 years ago
- KLEJ: 波兰语言理解的全面基准PDF4 years ago
Prev
Next