关键词automatic evaluation
搜索结果 - 65
- 评估大型语言模型在故事结局生成中的指令遵循能力PDF5 days ago
- FinTruthQA:评估金融信息披露质量的基准数据集PDF12 days ago
- ACL揭示 NLG 评估器的致命弱点:由大型语言模型驱动的统一对抗框架PDFa month ago
- LLM 作为自恋评估者:当自我膨胀影响评分PDF7 months ago
- 利用词语猜测游戏评估大型语言模型的智能PDF8 months ago
- 生成模型的自动评估与指令调优PDF8 months ago
- ACL基于解码器为基础的语言模型的文本生成自动评估方法探索PDF8 months ago
- EMNLP简化水平评估(SLE):用于句子简化的无参考学习简化指标PDF9 months ago
- 利用大型语言模型改进自动 VQA 评估PDF9 months ago
- 增强训练在自动化论文评分中的具体方法PDF10 months ago
- 错误中蕴藏着魔鬼的力量:利用大型语言模型进行细粒度机器翻译评估PDF10 months ago
- ICCVFunnyBirds:用于可解释 AI 方法的基于部件分析的合成视觉数据集PDFa year ago
- DSTC 11 跟踪器 4:开放域对话系统鲁棒性和多语言自动评估指标综述PDFa year ago
- 基于两两比较的 MOS 预测PDFa year ago
- ACLAlignScore: 用统一的对齐函数评估实际一致性PDFa year ago
- 使用下一句预测和互信息在潜空间中评估开放领域对话PDFa year ago
- LLM-Eval:用于大型语言模型开放域对话的统一多维自动评估PDFa year ago
- INSTRUCTSCORE:自动反馈的可解释文本生成评估方法PDFa year ago
- 你所看到的就是你所读到的?—— 改进文本 - 图像对齐评估PDFa year ago
- 极大预训练语言模型能否通过少量示例学习叙事?PDFa year ago
Prev