关键词pairwise human judgments
搜索结果 - 2
- 通过 GPT-4 分析人类偏好判断的影响因素
本文通过利用 Bradley-Terry-Luce 模型对 OpenAI 发布的配对人类判断数据集进行深入研究,探讨影响人类判断的关键因素,揭示了人类判断中的内在偏好,并提出了提高样本效率的策略。最后,本文对于人类判断评估中平衡数据集的构建 - EMNLP基于风格融合的面向受众的自然语言生成
本文提出了风格注入的新任务,旨在将样本的风格偏好融入到预训练语言生成模型中,以生成具备风格的文本。通过有限的人工判断,我们的方法可以为风格分析模型提供数据并增强其样本集,同时平衡流畅性和风格采用。实验结果表明,我们的注入方法可以生成具有吸引