Jan, 2024

Kun: 中文自对齐指导下的答案优化

TL;DR采用自我训练算法通过自给自足的方式生成高质量的指令调整数据集,为大规模语言模型的指令追踪能力提供一种可扩展和高效的解决方案。