Apr, 2023

探索使用大型语言模型进行基于参考文本无关的文本质量评估:初步实证研究

TL;DR通过比较三种基于ChatGPT或类似大型语言模型的无参考评估方法,实验证明ChatGPT能够有效地从不同角度评估文本质量,尤其是利用ChatGPT生成数字评分的Explicit Score方法最有效可靠。但是,直接使用ChatGPT比较两个文本的质量可能导致次优结果。