关键词text evaluation
搜索结果 - 7
- 从模型中心到人本中心:基于语言模型的应用中文本评估的修订距离度量PDF3 months ago
- ALLURE:一种用于迭代上下文学习的 LLM 文本评估的系统性审核和改进协议PDF9 months ago
- ChatEval:基于多智能体辩论的 LLM 评估器改进PDFa year ago
- 大型语言模型输出的评估:话语和记忆PDFa year ago
- GPTScore:任意评估PDFa year ago
- RISE: 利用检索技巧进行摘要评估PDF2 years ago
- PLM perplexity 不可靠于文本质量评估PDF2 years ago
Prev
Next