BriefGPT.xyz
Ask
alpha
关键词
crowdsourced human judgments
搜索结果 - 1
EMNLP
使用 MTurk 评估开放式文本生成的风险
本文对目前 45 篇与开放式文本生成相关的论文进行了调查,并发现它们中绝大多数未报告有关 Amazon Mechanical Turk 任务的关键细节,从而影响了可重复性。本文还进行了故事评估实验,发现即使使用严格的资格筛选器,AMT 工作
→
PDF
3 years ago
Prev
Next