关键词llm evaluators
搜索结果 - 3
  • 大规模语言模型生成中的幻觉检测:基于词元概率的方法
    PDFa month ago
  • 大型语言模型的评估存在不一致和偏见
    PDF2 months ago
  • 评价大型语言模型在指令遵循方面的表现
    PDF9 months ago
Prev
Next