Sep, 2021
借助人类反馈递归地对图书进行摘要
Recursively Summarizing Books with Human Feedback
Jeff Wu, Long Ouyang, Daniel M. Ziegler, Nisan Stiennon, Ryan Lowe...
TL;DR本文介绍利用机器学习方法,在小部分任务中辅助人类反馈来逐步完成整个任务, 并用所收集的大量数据 fine-tune GPT-3 模型,将其应用于整本小说的抽象式摘要,最后得到了可以在几个案例中与人类摘要匹配的,甚至匹配人类摘要质量的总结。