May, 2024

通过 LLM 支持的用户代理模拟增强对话状态跟踪模型

TL;DR利用 GPT-4 生成对话数据,通过在 LLaMA 2 上进行两阶段的微调,减少对话收集和注释成本,并表现出比仅使用真实数据训练的基准模型更好的性能,同时适应实际场景中的动态需求。