COLINGApr, 2024

基于个性化的大型语言模型的人工对话生成

TL;DR我们提供了一种新颖的端到端的基于个性的合成对话数据生成流程,专门设计用于通过提示语从大型语言模型中引出回应。我们设计了提示语以在用户与聊天机器人互动时考虑真实场景,生成更像人类的对话。我们介绍了 PSYDIAL,第一个专注于个性化对话的韩语对话数据集,该数据集使用我们提出的流程进行策划。值得注意的是,在我们的研究中,我们专注于大五人格模型中的外向性维度。实验结果表明,虽然预训练模型和用闲聊数据集进行微调的模型难以生成反映个性的回应,但用 PSYDIAL 进行训练的模型显示出显著的改进。我们的流程的通用性不仅限于对话任务,还可用于其他非对话相关的应用。这项研究为韩语和潜在的其他语言中更具细微差别、以个性为驱动的对话型人工智能开辟了更多可能性。我们的代码公开可用于此链接。