关键词metrics
搜索结果 - 166
  • 规则、自解释和领域不变的 GNN 的忠诚度的利弊
    PDF8 days ago
  • IJCAI回归任务中公平度测量方法的一致性
    PDF10 days ago
  • PruningBench: 结构剪枝全面基准
    PDF11 days ago
  • 具备解释识别结果能力的人工智能架构
    PDF16 days ago
  • WildBench:基于真实用户的挑战性任务对 LLMs 进行基准测试
    PDF22 days ago
  • 贝叶斯因果探索评估中的挑战与考虑
    PDF24 days ago
  • ADer: 综合多类视觉异常检测基准
    PDF24 days ago
  • SIGIR大型语言模型作为推荐系统:流行偏见的研究
    PDFa month ago
  • 深度回归的不确定性量化指标
    PDF2 months ago
  • 大数据生态系统中提升数据质量的 AI 驱动框架:错误检测、修正和元数据集成
    PDF2 months ago
  • 软标签 PU 学习
    PDF2 months ago
  • 统一并扩展用于评估生成模型的精确度和召回率指标
    PDF2 months ago
  • MM文本和音频简化:人类与 ChatGPT
    PDF2 months ago
  • 手写文件中信息提取的读取顺序无关度量
    PDF2 months ago
  • ACL分类评估指标的深入研究及对常见评估实践的批判性反思
    PDF2 months ago
  • IJCAI基于复杂网络理论的深度神经网络:一种观点
    PDF2 months ago
  • MAD Speech:语音声音多样性的度量
    PDF2 months ago
  • 场景图生成指标的综述与高效实现
    PDF2 months ago
  • 揭示以度量为重点的 LLM 评估:挑战与解决方案
    PDF2 months ago
  • $F_β$ 绘图 -- 用于评估不平衡数据分类器的可视化工具
    PDF3 months ago
Prev