May, 2023
ChatGPT在基准数据集上的系统研究和综合评估
A Systematic Study and Comprehensive Evaluation of ChatGPT on Benchmark
Datasets
Md Tahmid Rahman Laskar, M Saiful Bari, Mizanur Rahman, Md Amran Hossen Bhuiyan, Shafiq Joty...
TL;DR本文通过评估ChatGPT在各种自然语言处理任务中的表现,旨在验证其优缺点,并为未来的LLM研究提供思路。作者发现ChatGPT能够完成多种任务,取得很好的表现,但仍有许多难题需要解决。