May, 2024

通过LLM支持的用户代理模拟增强对话状态跟踪模型

TL;DR利用GPT-4生成对话数据,通过在LLaMA 2上进行两阶段的微调,减少对话收集和注释成本,并表现出比仅使用真实数据训练的基准模型更好的性能,同时适应实际场景中的动态需求。