BriefGPT.xyz
Ask
alpha
关键词
abstractive summary evaluations
搜索结果 - 1
大型语言模型是否适合作为抽象概括的评估器?
本文旨在探讨使用 LLMS(例如 “gpt-3.5-turbo”)作为自动评估器来评估摘要的性能,并比较了不同的评估方法和提示格式对其评估能力的影响。作者建议哪些提示格式可以提高 LLM 的性能,并讨论了 LLM 的评估能力随摘要质量和评估
→
PDF
a year ago
Prev
Next