May, 2023

日语聊天数据集的构建及其方法论

TL;DR该研究构建了一个日语聊天数据集,用于调整大型语言模型(LLMs),结果显示该数据集有可能对 LLMs 有利,但也揭示了在非英语语言中构建 LLMs 所面临的一些困难。