Apr, 2023
探索使用大型语言模型进行基于参考文本无关的文本质量评估:初步实证研究
Exploring the Use of Large Language Models for Reference-Free Text
Quality Evaluation: A Preliminary Empirical Study
TL;DR通过比较三种基于ChatGPT或类似大型语言模型的无参考评估方法,实验证明ChatGPT能够有效地从不同角度评估文本质量,尤其是利用ChatGPT生成数字评分的Explicit Score方法最有效可靠。但是,直接使用ChatGPT比较两个文本的质量可能导致次优结果。