counterfactual generation | BriefGPT

关键词counterfactual generation

搜索结果 - 9

利用反事实生成减轻文本毒性
通过使用反事实生成方法以及可解释性人工智能（XAI）领域的方法来目标化和缓解文本毒性，我们提出了一种文本解毒方法，该方法能够在去除有害含义的同时保留初始非毒性含义，并且对三个数据集进行比较实证研究和评估结果表明，最近发展的 NLP 反事实生
PDF2 months ago
因果扩散自编码器：通过扩散概率模型实现反事实生成
提出了 CausalDiffAE，一种基于扩散的因果表示学习框架，能够根据指定的因果模型实现反事实生成，并通过编码器从高维数据中提取语义上有意义的因果变量，以及使用神经网络参数化潜在因果变量之间的因果机制。
PDF2 months ago
利用对抗样本进行偏见缓解和准确性增强
利用对抗生成和微调的新方法来减轻计算机视觉模型中的偏见，通过使用欺骗深度神经网络但不欺骗人类的对抗图像作为反事实进行公正模型训练，通过 qualitatively 和 quantitatively 的评估证明了相比于现有方法，我们的方法实现
PDF3 months ago
具有可辨识性保证的反事实生成
本文研究了对抗生成方法中存在于多个领域的内容和风格变量之间的依赖关系的问题，并提出了一种名为 MATTE 的理论驱动框架，实现了无监督风格迁移任务的最先进性能，不需要配对数据或风格标签。
PDF4 months ago
探索面向以人为中心的人工智能的对抗性调整损失
基于反事实生成的人类中心框架实现对深度神经网络的解释引导学习，并显示对人体的准确对齐，从而在肺癌诊断数据集上展示出的有效性。
PDF9 months ago
大型语言模型作为反事实生成器：优缺点
本研究探究了大型语言模型（LLMs）进行反事实生成和数据增强的能力，发现 LLMs 很有效的进行反事实生成，但因为自身限制和缺少实用逻辑指导，在某些复杂任务上表现欠佳。提供准确的任务定义和详细的操作步骤对于在 LLMs 中生成反事实具有决定
PDFa year ago
ACL通过性别不明确的代词进行反事实偏见评估的计数器
本文提出了一种新的方法通过反事实生成来收集多样性，自然性和最小距离的文本对，并构建了一个由 4008 个实例分成 1002 个四重组成的 Counter-GAP 注释数据集，以评估语言模型在固指消解中的性别偏见问题。作者使用四重组级别指标解
PDFa year ago
混淆下的反事实生成
在机器学习中，当训练数据受到观测或未观测到的混淆影响时，生成的关系可能会与部署时相差较大。本文提出了一种基于因果生成过程的对抗性生成方法，以最小化生成因素之间的关联性，从而生成有效对抗性数据用于训练图像分类器，即使训练数据受到高度混淆的影响
PDF2 years ago
EMNLP使用潜在解缠和反事实生成消除词嵌入中的性别偏见
通过 siamese auto-encoder 和 adapted gradient reversal layer 的方法，我们提出了一种注意 semantic latent 信息和 gender latent 信息的词向量去偏见化的方法，
PDF4 years ago