Apr, 2024

利用预测的潜在人格维度进行反事实推理,以优化说服结果

TL;DR使用双向生成对抗网络(BiCoGAN)结合基于对话的人格预测回归模型(DPPR)的方法,追踪用户的潜在人格维度(LPDs),并生成基于这些 LPDs 的定制的反事实话语,优化整体说服结果。在在线交互中,通过使用 D3QN 模型学习优化系统话语选择策略,采用反事实推理和 LPDs 优化增强学习策略来提高说服效果。