ICMLNov, 2023

用户生成文本在创作领域中的流行度受到哪些因素的影响?图书评论案例研究

TL;DR本研究通过对书评的心理、词汇、语义、易读性等特征进行统计分析,使用两种易读性测试探索阅读便利程度与书评受欢迎程度的正向关联,并运用传统机器学习分类器和基于 Transformer 的预训练语言模型,自动判断书评的受欢迎程度。研究结果表明,除了一些特征(例如书评长度、情感和词语独特性)之外,大多数属性在受欢迎和不受欢迎的书评组之间没有显著差异。此外,使用词语 N-gram 特征的机器学习分类器的低性能凸显了在判断创意领域受欢迎程度方面所面临的挑战。总体而言,本研究揭示了影响书评受欢迎程度的因素,并强调了进一步研究的需要,尤其是在创意领域。