Mar, 2024
最小人工投入快速开发大型语言模型的高质量指导数据和评估基准:以日语为例的案例研究
Rapidly Developing High-quality Instruction Data and Evaluation
Benchmark for Large Language Models with Minimal Human Effort: A Case Study
on Japanese
TL;DR我们提出了基于GPT-4的高效自指导方法,通过翻译少量英语指令并进行修订,为日语构建高质量的指令数据和评估基准,并证明使用我们的GPT-4自指导数据进行微调的模型在所有三个基本预训练模型上表现明显优于Japanese-Alpaca。