关键词automatic metrics
搜索结果 - 59
  • EMNLP文本摘要质量评估方法的比较研究
    PDF4 days ago
  • COLING评估 IWSLT2023 语音翻译任务:人工标注、自动评估和分割
    PDFa month ago
  • 自动指标能否评估高质量翻译?
    PDFa month ago
  • 多语言对话代理的准备工作被低估了
    PDFa month ago
  • 关于非自回归翻译中的信息冗余
    PDF2 months ago
  • 探索会议总结的自动评价指标
    PDF3 months ago
  • 在自然语言生成系统评估中,引用是否有必要?何时何地?
    PDF3 months ago
  • 上下文对聊天翻译评估是否有帮助?
    PDF4 months ago
  • 基于错误人工评估的 GPT-4 在句子简化中的深入评估
    PDF4 months ago
  • EMNLP自动机器翻译度量指标的鲁棒性测试与对抗攻击
    PDF8 months ago
  • EMNLPBLESS:句子简化上的大型语言模型基准测试
    PDF8 months ago
  • 通过 WordNet 层次结构评估文本到图像模型的上义词理解
    PDF9 months ago
  • 通过多模态大规模语言模型引导基于指导的图像编辑
    PDF9 months ago
  • LongDocFACTScore: 长文本摘要的事实评估
    PDF9 months ago
  • StoryBench:用于连续故事可视化的多面向指标
    PDF10 months ago
  • ACLBLEURT 具有通用翻译能力:最小风险训练下自动度量分析
    PDFa year ago
  • HAUSER: 面向综合和自动评价的比喻生成技术研究
    PDFa year ago
  • 让大型语言模型能够生成带有引文的文本
    PDFa year ago
  • 如何选择聊天机器人:用于对话指标评估的大规模多系统多参考数据集
    PDFa year ago
  • 使用 ChatGPT 进行文本风格转移的多维度评估
    PDFa year ago
Prev