关键词nlp benchmarks
搜索结果 - 26
  • 基于预训练大型语言模型的乌尔都自然语言处理任务潜力评估
    PDF9 days ago
  • 基于 BERT 的句子分类的神经架构搜索
    PDF2 months ago
  • VariErr NLI:将注释错误与人类标签变异分离
    PDF3 months ago
  • 维果茨基距离:用于基准任务相似性度量
    PDF3 months ago
  • 合作还是企业控制?量化 NLP 对工业产物和贡献的依赖程度
    PDF6 months ago
  • LIMIT: 指令调整跨评估范式中的越少越好
    PDF6 months ago
  • PsyBench: 一个平衡且深入的心理学中文评估基准
    PDF7 months ago
  • 探究语言模型中的「秘密语言」存在
    PDF10 months ago
  • ACL为预训练语言模型提供常识知识转移
    PDFa year ago
  • ACL模型生成的预训练信号改进了文本 - 文本转换器的零 - shot 泛化能力
    PDFa year ago
  • C-Eval: 一种基于多级多学科的中文评估套件,用于基础模型
    PDFa year ago
  • ACL蒸馏逐步!用更少的训练数据和更小的模型尺寸胜过更大的语言模型
    PDFa year ago
  • LaMini-LM:用大规模指令生成多样化的蒸馏模型集群
    PDFa year ago
  • 人类和语言模型中的任务歧义
    PDFa year ago
  • EMNLPSEAL : 交互式系统误差分析和标记工具
    PDF2 years ago
  • EMNLP一个问题分解单元就足够了吗?
    PDF2 years ago
  • 使用计算语言模型预测人类心理测量属性
    PDF2 years ago
  • ACL长上下文 NLP 模型中效率与准确性的权衡特征
    PDF2 years ago
  • ACLMukayese:土耳其自然语言处理反击
    PDF2 years ago
  • EMNLPSCROLLS: 标准化的长文本序列比较
    PDF2 years ago
Prev