关键词evaluation methodologies
搜索结果 - 32
  • 多种医学模态下的合成数据生成人工智能:最新发展及挑战的系统综述
    PDF7 days ago
  • 提高多变量时间序列分类的解释方法评估和可操作性
    PDF16 days ago
  • 利用估计目标框架提高人工智能 / 机器学习评估的有效性和实用性
    PDF20 days ago
  • JailbreakEval: 评估大型语言模型遭受越狱攻击的综合工具包
    PDF21 days ago
  • 面向联邦域去学习的验证方法和挑战
    PDFa month ago
  • 文本生成:任务、评估和挑战的系统文献综述
    PDFa month ago
  • 评估 LLMs 在时间泛化上的表现
    PDF2 months ago
  • 生成范式中的跨度提取评估:关于面向方面的情感分析的思考
    PDF3 months ago
  • Khayyam 挑战(波斯 MMLU):你的 LLM 是否真的掌握了波斯语?
    PDF3 months ago
  • FreeEval: 大型语言模型的可靠高效评估的模块化框架
    PDF3 months ago
  • 零样本多任务幻觉检测
    PDF4 months ago
  • 基于错误人工评估的 GPT-4 在句子简化中的深入评估
    PDF4 months ago
  • 大型多模态代理:综述
    PDF4 months ago
  • ICML实用自动语音识别与后处理:可解释错误基准指南的呼吁
    PDF5 months ago
  • 构建与伊斯兰世界观相符的领域专用 LLMs:幻觉还是技术可能性?
    PDF7 months ago
  • 现代大语言模型中数据污染问题研究
    PDF8 months ago
  • ViLMA:视频 - 语言模型中的语言与时间基准的零样本评测
    PDF8 months ago
  • EMNLP后图灵:LLM 评估地图绘制
    PDF8 months ago
  • 超越文档页面分类:设计、数据集和挑战
    PDF10 months ago
  • 印象感知推荐系统
    PDFa year ago
Prev