关键词benchmark evaluation
搜索结果 - 18
  • Disce aut Deficere:评估 LLMs 对 INVALSI 意大利基准的熟练度
    PDF7 days ago
  • NYC 室内长期视觉地点识别数据集与半自动标注
    PDF3 months ago
  • 基于法语的临床命名实体识别性能评估
    PDF3 months ago
  • 面向麻醉学的中文大型语言模型训练
    PDF4 months ago
  • 当基准成为目标:揭示大型语言模型排行榜的敏感性
    PDF5 months ago
  • 第四届神经网络验证国际比赛 (VNN-COMP 2023):概述与结果
    PDF6 months ago
  • UHGEval:通过无约束生成对中国大型语言模型的幻觉进行基准测试
    PDF7 months ago
  • 基于卷积和 Transformer 的视频帧插帧网络
    PDFa year ago
  • 如何训练一款基于多模态输入的 GPT4 风格语言模型?
    PDFa year ago
  • DUBLIN -- 语言 - 图像网络理解文档
    PDFa year ago
  • 使用对比式 3D 人体动作合成进行文本到动作的检索
    PDFa year ago
  • AAAI面向对话 AI 的常识推理:现有技术综述
    PDFa year ago
  • EMNLPDial2vec: 自导对比学习非监督对话嵌入
    PDF2 years ago
  • ACL用 FIRE 对抗火灾:评估文本到视频检索基准的有效性
    PDF2 years ago
  • ECG 生物特征识别:评述、系统提出和基准评估
    PDF2 years ago
  • 基准测试可解释性人工智能的反事实算法:从白盒到黑盒
    PDF2 years ago
  • EvidentialMix: 结合开放集和封闭集噪声标签的学习
    PDF4 years ago
  • TriGAN:多源域适应的图像到图像翻译
    PDF4 years ago
Prev
Next