关键词evaluating
搜索结果 - 17
  • 大型语言模型作为推荐解释的评估器
    PDFa month ago
  • 生成学生:利用 LLM 模拟的学生档案支持问题项目评估
    PDFa month ago
  • NL2FOL:将自然语言翻译为一阶逻辑,用于检测逻辑谬误
    PDF2 months ago
  • 比较聚类方法使用相对有效性指数的研究
    PDF3 months ago
  • Chatbot Arena: 通过人类偏好评估 LLM 的开放平台
    PDF4 months ago
  • COLINGQsnail:顺序问题生成的问卷数据集
    PDF4 months ago
  • 2024 年大型语言模型的事实性
    PDF5 months ago
  • 大型语言模型中的事实性调查:知识、检索与领域特定性
    PDF9 months ago
  • 严格评估神经元的自然语言解释
    PDF9 months ago
  • 结合自动编码和教师输入以生成异步在线讨论的 ENA 可视化
    PDF10 months ago
  • 使用一致性检查评估超人模型
    PDFa year ago
  • 大型语言模型在算术任务中的表现如何?
    PDFa year ago
  • 传统和深度学习模型对纵向医疗记录的可解释性
    PDF2 years ago
  • 面向情感感知的对话代理
    PDF2 years ago
  • ACL将人类和统计评估统一为一体:自然语言生成
    PDF5 years ago
  • 用于讽刺的大型自注释语料库
    PDF7 years ago
  • KDD顺序特征解释用于异常检测
    PDF9 years ago
Prev
Next