Oct, 2023

基于大型语言模型的个性化文本生成的自动评估

TL;DR个性化文本生成采用了一种专门的机制来提供与用户个人背景相关的内容,并且尽管这一领域的研究进展很快,但仍存在着评估方面的挑战。本研究提出了 AuPEL 作为一种新颖的评估方法,通过大型语言模型对个性化文本生成进行评估,用以满足人工评估的高成本和传统文本相似度度量方法的不足。实验证明,与现有的评估指标相比,AuPEL 不仅可以更准确地区分和排名模型的个性化能力,而且在此任务中表现出令人称赞的一致性和高效性。