关键词evaluation metrics
搜索结果 - 476
  • ACLAgentQuest: 一个模块化的基准测试框架,用于衡量和提升 LLM 代理的进展
    PDF3 months ago
  • 偶然输入条件下的在线学习:综合评述与分析
    PDF3 months ago
  • 增强上下文感知的视频摘要
    PDF3 months ago
  • EASSE-DE:德文自动句子简化评估的更简易方法
    PDF3 months ago
  • COLING评价信息抽取中的生成式语言模型作为主观问题纠正
    PDF3 months ago
  • 重新思考标注模拟:全身 PET 病灶交互分割方法的实际评估
    PDF3 months ago
  • 对对抗性图像生成方法的基准测试
    PDF3 months ago
  • COLING神经多模态主题建模:全面评估
    PDF3 months ago
  • ICCV 2023 第一届科学图像标题生成挑战的解决方案
    PDF3 months ago
  • 评估文本到图像合成:图像质量指标的调查和分类
    PDF4 months ago
  • LMStyle 基准测试:评估聊天机器人的文本风格转移
    PDF4 months ago
  • 提升幸福感:通过图像扩散模型引发情绪
    PDF4 months ago
  • 大型视觉语言模型中评估和缓解数字幻觉:一种一致性视角
    PDF4 months ago
  • 评估神经网络的可视连续性腐败鲁棒性相对于人类表现
    PDF4 months ago
  • RORA: 强健自由文本理由评估
    PDF4 months ago
  • KDD研究随机性对深度神经网络进行森林火灾预测评估的影响
    PDF4 months ago
  • 鹰:真实互动的伦理数据集
    PDF4 months ago
  • UFO: 一个用于评估大型语言模型事实性的统一灵活框架
    PDF4 months ago
  • COLING低资源南亚语言中的多语言共指消解
    PDF5 months ago
  • 音乐生成的结构导向位置编码
    PDF5 months ago