关键词validity
搜索结果 - 22
  • 用大型经验研究代替人类法官?跨 20 个 NLP 评估任务
    PDF8 days ago
  • 评估用于大型视觉语言模型的幻觉基准的质量
    PDF10 days ago
  • 利用估计目标框架提高人工智能 / 机器学习评估的有效性和实用性
    PDF20 days ago
  • ECBD: NLP 的证据中心基准设计
    PDF21 days ago
  • 使用主动学习量化本地模型的有效性
    PDF23 days ago
  • 评估数学推理能力的准确性以外的因素
    PDF3 months ago
  • 保证覆盖的预测集合 —— 针对外部数据的
    PDF3 months ago
  • VISREAS: 复杂视觉推理与无法回答的问题
    PDF4 months ago
  • 使用结构化叙述提示生成的 GPT-4 人生事件叙述:验证研究
    PDF5 months ago
  • 数字空间中的情感分析:对评论的概述
    PDF8 months ago
  • 基于机器学习的科学报告标准
    PDFa year ago
  • Weisfeiler 和 Lehman 度量建模:探究 WL 检验的有效性
    PDFa year ago
  • 大型语言模型中的人格特质
    PDFa year ago
  • CasTGAN: 级联生成对抗网络用于逼真的表格数据合成
    PDFa year ago
  • 早期阶段围绕 AI 和政策设计的辩论,重新归位有效性的考虑
    PDFa year ago
  • 从哥德尔不完备定理到机器人信仰的完备性(扩展摘要)
    PDFa year ago
  • AI 招聘中使用的人格预测有效性的外部稳定性审核框架
    PDF2 years ago
  • ACL针对对抗性输入的神经自动化论文评分和连贯性建模
    PDF6 years ago
  • ICLR学习复杂离散结构的有效性生成模型
    PDF7 years ago
  • NIPS带或不带有效性保证的大规模概率预测器
    PDF9 years ago
Prev