ACLMar, 2024

人类语言模型协作的因果推断

TL;DR在本研究中,我们研究了人类和语言模型 (LMs) 之间的协同动力学,其中互动通常涉及 LM 提出文本段落而人类对这些提案进行编辑或回应。通过历史上人类和 LM 之间的相互作用,有效地与 LM 进行互动需要人类识别出适当的基于文本的互动策略,如编辑和回应风格。我们引入了一个新的因果估计标量 ——“增量风格效应 (Incremental Stylistic Effect, ISE)” 来回答由因果推理问题引起的困难,该问题是一个反事实的 “如果” 问题:如果人类采用不同的文本编辑 / 完善策略,协同的结果会如何改变?我们建立了非参数标识 ISE 的条件,并在此基础上开发了 CausalCollab 算法,用于估计动态人类 - LM 协作中各种互动策略的 ISE。在对三种不同的人类 - LM 协作场景进行的实证研究中,我们发现 CausalCollab 能够有效减少混淆,显著改善对照估计与竞争基线相比。