May, 2024

语言模型是否喜欢自己的故事?用于自动故事评估的大型语言模型的激励

TL;DR自动故事评估与生成在社交交互中起到重要作用,研究表明大语言模型能够替代人工评注者,但仍存在解释答案的困难。