关键词automatic evaluation metrics
搜索结果 - 48
  • 零射击机器翻译评估对于印度低资源语言有多好?
    PDFa month ago
  • ACLSLIDE: 一个融合小型和大型语言模型的开放领域对话评估框架
    PDFa month ago
  • 绿色:生成性放射学报告评估和错误标注
    PDF2 months ago
  • OARelatedWork:一种来自开放获取资源的大规模相关工作段落全文数据集
    PDF2 months ago
  • RepEval: LLM 表征的有效文本评估
    PDF2 months ago
  • 大型语言模型是语法错误修正的最先进评估器
    PDF3 months ago
  • 大型语言模型 “ad referendum”: 在法律领域的机器翻译水平如何?
    PDF5 months ago
  • JaSPICE:基于谓词 - 论元结构的自动评估度量方法用于图像字幕模型
    PDF8 months ago
  • FETV:开放领域文本视频生成的细粒度评估基准
    PDF8 months ago
  • EMNLP评估指标在 GPT-4 时代:可靠评估大型序列到序列任务上的语言模型
    PDF8 months ago
  • 在段落级别上训练和元评估机器翻译评估指标
    PDF10 months ago
  • 针对法律摘要的论证段落增强
    PDFa year ago
  • 不是所有指标都有罪:利用 LLM 改进 NLG 评估的修辞转换技术
    PDFa year ago
  • ChartSumm: 长短汇总自动图表概括的综合基准
    PDFa year ago
  • 使用 ChatGPT 进行类人摘要评估
    PDFa year ago
  • 重新审视生物医学领域中自动问题摘要评估
    PDFa year ago
  • PR-MCS: 针对多语言图像字幕生成的扰动鲁棒度量
    PDFa year ago
  • CVPRSpaText: 控制型图像生成的空间文本表示
    PDF2 years ago
  • 推理电路:基于结构化理由的少样本多跳问题生成
    PDF2 years ago
  • EMNLP能量排名提升抽象化摘要
    PDF2 years ago
Prev