关键词automatic metrics
搜索结果 - 59
  • ACLSWING: 对话摘要的覆盖率和准确性的平衡
    PDFa year ago
  • TikTalk: 一个实际闲聊的多模态对话数据集
    PDFa year ago
  • 自然语言生成的人类似评估及其误差分析
    PDF2 years ago
  • 重新审视黄金标准:用稳健的人类评估来立足摘要评估
    PDF2 years ago
  • MT Metrics 与人类对同声传译的评分相关
    PDF2 years ago
  • WMT22 通用机器翻译任务的自动评估
    PDF2 years ago
  • COLING人类标准与自动度量 —— 评估故事生成的基准
    PDF2 years ago
  • ACL机器翻译人类评估的有效性改进探讨
    PDF2 years ago
  • 关于释义生成的评估度量
    PDF2 years ago
  • 评估机器翻译系统:一个理论框架
    PDF2 years ago
  • 叙事生成中实体使用的连贯和一致性探索
    PDF2 years ago
  • 人类评估对话的敏感度是个开放性问题:比较不同的方法用于评估对话代理
    PDF2 years ago
  • 探究预训练语言模型对对话评价的影响
    PDF3 years ago
  • 自动机器翻译评估指标的全面评估:是否需要进行交付
    PDF3 years ago
  • ACL你熟悉哪些摘要数据集?
    PDF3 years ago
  • ACL在线学习与机器翻译评估:以最少的人力努力找到最佳系统
    PDF3 years ago
  • ACLOpenMEVA:用于评估开放式故事生成指标的基准
    PDF3 years ago
  • ACL具有风格引导计划的风格化故事生成
    PDF3 years ago
  • ACLBlonDe:一种用于文档级机器翻译的自动评估指标
    PDF3 years ago
  • COLING评估测量经常在低分数范围内出现分歧:重新审视摘要评估测量指标
    PDF4 years ago