关键词evaluation criteria
搜索结果 - 37
  • 推动零售数据科学:合成数据的综合评估
    PDF15 days ago
  • 评估计算机视觉模型的社会技术视角:基于性别和情绪检测与推理的案例研究
    PDF22 days ago
  • QGEval:一个用于问题生成评估的基准
    PDF25 days ago
  • 面部图像合成的特征提取网络分析
    PDFa month ago
  • 评估解释的统一框架
    PDFa month ago
  • 学生软件项目评估的模糊智能系统
    PDF2 months ago
  • 传统模型与大型语言模型的机器遗忘:简要调查
    PDF3 months ago
  • EasyRL4Rec:基于强化学习的推荐系统用户友好代码库
    PDF4 months ago
  • TimeSeriesBench:时间序列异常检测模型的工业级基准
    PDF5 months ago
  • NLP 中文本数据增强的评估指标
    PDF5 months ago
  • 2AFC 大型多模态模型的图像质量评估
    PDF5 months ago
  • 图形压缩:一项调查
    PDF5 months ago
  • 基于深度学习的车辆重新识别综述:模型、数据集和挑战
    PDF5 months ago
  • 视觉 Transformer 的可解释性:综述与新的观点
    PDF8 months ago
  • EMNLP后图灵:LLM 评估地图绘制
    PDF8 months ago
  • 合作评估:探索大型语言模型与人类在开放式生成评估中的协同作用
    PDF8 months ago
  • 大型基础模型中的幻觉调查
    PDF10 months ago
  • 评估语言模型中知识编辑的连锁反应
    PDFa year ago
  • 非监督式异质传感器信号变点检测
    PDFa year ago
  • MedGPTEval: 一份用于评估大型医学语言模型响应的数据集和基准测试
    PDFa year ago
Prev