关键词automatic evaluation metrics
搜索结果 - 48
- 零射击机器翻译评估对于印度低资源语言有多好?PDFa month ago
- ACLSLIDE: 一个融合小型和大型语言模型的开放领域对话评估框架PDFa month ago
- 绿色:生成性放射学报告评估和错误标注PDF2 months ago
- OARelatedWork:一种来自开放获取资源的大规模相关工作段落全文数据集PDF2 months ago
- RepEval: LLM 表征的有效文本评估PDF2 months ago
- 大型语言模型是语法错误修正的最先进评估器PDF3 months ago
- 大型语言模型 “ad referendum”: 在法律领域的机器翻译水平如何?PDF5 months ago
- JaSPICE:基于谓词 - 论元结构的自动评估度量方法用于图像字幕模型PDF8 months ago
- FETV:开放领域文本视频生成的细粒度评估基准PDF8 months ago
- EMNLP评估指标在 GPT-4 时代:可靠评估大型序列到序列任务上的语言模型PDF8 months ago
- 在段落级别上训练和元评估机器翻译评估指标PDF10 months ago
- 针对法律摘要的论证段落增强PDFa year ago
- 不是所有指标都有罪:利用 LLM 改进 NLG 评估的修辞转换技术PDFa year ago
- ChartSumm: 长短汇总自动图表概括的综合基准PDFa year ago
- 使用 ChatGPT 进行类人摘要评估PDFa year ago
- 重新审视生物医学领域中自动问题摘要评估PDFa year ago
- PR-MCS: 针对多语言图像字幕生成的扰动鲁棒度量PDFa year ago
- CVPRSpaText: 控制型图像生成的空间文本表示PDF2 years ago
- 推理电路:基于结构化理由的少样本多跳问题生成PDF2 years ago
- EMNLP能量排名提升抽象化摘要PDF2 years ago
Prev