Dec, 2023

基于监督和自组织的上下文学习任务表现和模型校准

TL;DR探索了标准的有监督微调(SFT)和上下文学习(ICL)两种方法在低资源环境中存在的过度自信和误校准问题,提出了使用自我集成技术来增强预测校准性和性能,为选择学习范式以及如何提升大语言模型的任务性能和校准性提供了具体指导。