May, 2024

利用大型语言模型引发信息丰富的文本评价

TL;DR利用大型语言模型,本研究引入了两种机制,即生成式同伴预测机制(GPPM)和生成式简介同伴预测机制(GSPPM),以扩大同伴预测机制的应用范围至基于文本的报告,并理论上证明当语言模型预测足够准确时,该机制能够激励高质量的反馈。在实证研究中使用了 Yelp 评论数据集和 ICLR OpenReview 数据集,结果表明在 ICLR 数据集上,该机制能够根据期望得分区分人工编写的评论、GPT-4 生成的评论和 GPT-3.5 生成的评论,并且 GSPPM 比 GPPM 更有效地惩罚产生自语言模型的评论。