关键词evaluation metric
搜索结果 - 112
  • VIEScore:面向条件图像合成评估的可解释度量
    PDF6 months ago
  • 关于会话推荐中遗忘机制的有效性研究
    PDF6 months ago
  • Reason2Drive:面向自动驾驶的可解释和链式推理
    PDF7 months ago
  • 评估 ChatGPT 在中文拼写纠错中的性能的新度量标准 Eval-GCSC
    PDF8 months ago
  • FAITHSCORE:评估大型视觉语言模型中的幻觉
    PDF8 months ago
  • GEMBA-MQM: 用 GPT-4 检测翻译质量错误片段
    PDF9 months ago
  • EMNLPCodeTransOcean:一项用于代码翻译的全面多语言基准
    PDF9 months ago
  • 弱监督语义分割中的小物体重要性
    PDF9 months ago
  • 文本生成动作的最佳自动评估指标是什么?
    PDF10 months ago
  • MDSC:评估音乐与之间的风格一致性
    PDF10 months ago
  • 基于机器学习的视频编解码器的全参考视频质量评估
    PDF10 months ago
  • 实用的无监督领域自适应评估指标研究
    PDFa year ago
  • 语言生成系统的否定感知评估
    PDFa year ago
  • 学习和评估人类对话头生成的偏好
    PDFa year ago
  • 无上下文的多样手势类型交互分割
    PDFa year ago
  • TopP&R:评估生成模型的保真度和多样性的鲁棒支持估计方法
    PDFa year ago
  • ConceptBed: 评估文本到图像扩散模型的概念学习能力
    PDFa year ago
  • ACL关于日语语音识别的宽松评估:建模自然发生的拼写不一致性
    PDFa year ago
  • ACLOpenPI-C: 开放词汇状态跟踪的更好基准和更强基础线
    PDFa year ago
  • 潜在魔法:对语义潜空间中制造的对抗样本的调查
    PDFa year ago