Jan, 2024

通过人类反馈提高分类性能:标注一部分,剩下的我们来标注

TL;DR借助大语言模型,本文着眼于通过少量标注样本来显著提高模型准确性,从而通过持续的人类反馈循环改进人工智能模型的准确度、回归率和精确度。通过在金融短语库、银行、Craigslist、Trec 和亚马逊评论数据集上的基准测试,证明了即使只有少量标注样本,我们也能超过零样本大语言模型的准确性,提供更好的文本分类性能,而无需手动标记数百万行数据。