BriefGPT.xyz
Ask
alpha
关键词
eli5
搜索结果 - 2
WebGPT: 借助浏览器进行问题回答并获得人类反馈
在文本浏览环境中使用 GPT-3 进行长篇问题回答的模型训练,通过模仿学习和人类反馈优化答案质量,并使用 ELI5 数据集对模型进行评估和训练,最佳模型通过行为克隆和逆向采样获得,最终得到的答案比 Reddit 上评分最高答案及人类演示者的
→
PDF
3 years ago
长文本问答
这篇论文介绍了第一个大规模的长篇问答语料库,其中包括了 270,000 个 Reddit 论坛上的线索,使用多任务目标的诠释性模型表现最佳,但仍存在改进的余地。
PDF
5 years ago
Prev
Next