利用预测的潜在人格维度进行反事实推理，以优化说服结果

Apr, 2024

利用预测的潜在人格维度进行反事实推理，以优化说服结果

Counterfactual Reasoning Using Predicted Latent Personality Dimensions for Optimizing Persuasion Outcome

Donghuo Zeng, Roberto S. Legaspi, Yuewen Sun, Xinshuai Dong, Kazushi Ikeda...

TL;DR使用双向生成对抗网络（BiCoGAN）结合基于对话的人格预测回归模型（DPPR）的方法，追踪用户的潜在人格维度（LPDs），并生成基于这些 LPDs 的定制的反事实话语，优化整体说服结果。在在线交互中，通过使用 D3QN 模型学习优化系统话语选择策略，采用反事实推理和 LPDs 优化增强学习策略来提高说服效果。

Abstract

Customizing persuasive conversations related to the outcome of interest for specific users achieves better persuasion results. However, existing persuasive conversation systems rely on persuasive strategies and encounter challenges in dynamically adjusting dialogues to suit the evolvin

persuasive conversations user customization personalization counterfactual reasoning reinforcement learning

发现论文，激发创造

具有隐式用户人设检测的个性化对话生成器

提出了一种基于用户人格检测的个性化对话生成器，该方法使用条件变分推理建立用户潜在人格模型并利用后验鉴别正则化提高训练效果，在实证研究中实现比现有技术更高的对用户人格关注和提升了对话品质的效果。

Apr, 2022

神经响应生成的反事实离线训练

本文提出采用反事实推理来探索潜在回应，并在 DailyDialog 数据集上实验证明在仿真产生回应时更优，训练反事实回应可以帮助探索潜在回应空间的高奖励区域。

Apr, 2020

基于视角转换的反事实数据增强方法在开放域对话中的应用

本文提出了一种数据增强方法以及筛选技术来增加开放域对话系统数据集中不同语义的高质量回复，通过对事实的推理来推断出具有不同语义的回复，并过滤掉有害的增强回复，实验结果表明，该方法可以在多个下游任务中胜过竞争基线。

Oct, 2022

借助因果推理增强语言理解

本研究提出了反事实推理模型，在学习少量反事实样本的基础上，通过生成对于每个正面事实样本的代表性反事实样本，并使用回顾模块根据对比反事实和正事实样本来检查模型预测，从而模拟对于困难测试样本的人类反事实思维。该方法在情感分析和自然语言推理方面的广泛实验验证了其有效性。

Jun, 2021

使用反事实数据处理器调整大型语言模型

探究利用反事实提示以及直接偏好优化框架来对齐模型风格的方法，该方法有效地注入了良好的行为并减轻了不理想的情况，鼓励模型忽略不合适的指令，从而以低成本的方式使大型语言模型满足对负责任和道德对齐的人工智能系统的需求。

Jan, 2024

借助大语言模型生成忠实的以人为基础的对话数据集

通过建立 Generator-Critic 架构，使用 LLM 生成会话，借助 Synthetic-Persona-Chat 评估了高质量对话数据集对 NLP 模型的影响。

Dec, 2023

PersonalityChat: 基于事实和特征的个性化对话建模的会话提炼

本文利用大型语言模型（LLM）通过个性化对话生成，基于个人特点和人格特质创建了一个合成对话数据集，从而证明了个性化对话模型和与 PersonaChat 相比的表现优势。

Jan, 2024

长期对话中的因果知觉位置去偏微调

我们提出了一种名为 CPD 的新方法，它利用基于干扰的因果变量发现方法从对话历史中提取因果相关的话语，并在微调过程中增强模型的因果感知能力，以解决大型语言模型在长期对话中生成无关紧要和通用回应的固有位置偏倚问题。在两个数据集上的实验结果证明，我们的方法可以有效减轻多个大型语言模型的位置偏倚，并与现有基线相比取得显著进展。

Jun, 2024

通过潜在空间的解缠释义实现回归

本文提出了一种新的方法，通过首先将潜空间中的标签无关特征与预定义的输出相结合，以为预先训练的回归器生成对立解释。通过在潜空间中搜索，我们展示了该方法在回归问题设置下重要高维机器学习应用中具有竞争力。

Nov, 2023

CoCo: 用于评估对话状态跟踪器的可控因果推断

本文提出使用可控反事实推理 (CoCo) 来对话状态跟踪模型（DST）进行鲁棒性评估，利用 CoCo 生成的反事实对话场景来评估在 MultiWOZ 数据集上的 DST 模型，结果表明相对于传统的技术方法，CoCo 会对 DST 模型的性能造成相当大的影响。

Oct, 2020