Oct, 2023

大规模语言模型对于超领域逻辑推理任务的系统评估

TL;DR大型语言模型在逻辑推理任务中的泛化性和鲁棒性评估及改善的研究。