- 缺失值处理的简单方法:Knockout
通过输入掩蔽的方式,我们提出了一种高效的方法来同时学习使用完整输入的条件分布和使用部分输入的边缘分布,从而帮助单个模型有效地学习条件分布和边缘分布。
- 概率和因果可满足性:边缘化的影响
研究了 Pearl 的因果层次结构 (PCH) 框架中的推理和计算复杂性,重点关注概率和因果语言中表达的满足性问题,特别是与边缘化相关的方程,证明了不同层次和操作符的确切计算复杂性结果,以及对受限模型进行了考虑。
- 关于以求和运算符进行概率和因果推理
引入求和运算符来捕捉应用程序中常见的设备,如 Pearl(2009)的因果推断中的 $do$-calculus,其中大量使用边际化。我们对使用边际化的概率和因果推理的复杂性进行了完全的特征化,证明了它们仍然等同困难。
- ACL拉丁美洲土著语言的自然语言处理进展
该论文聚焦于快速技术进步面前土著语言社区的边缘化问题,强调这些语言的文化丰富性以及它们在自然语言处理领域被忽视的风险。我们旨在弥合这些社区与研究人员之间的鸿沟,强调尊重土著社区观点的包容性技术进步的必要性。我们展示了拉丁美洲土著语言在自然语 - 关于概率序列模型的高效边缘化
使用自回归模型回答超出单步预测的复杂概率查询,包括未来事件的时机和特定事件在另一事件发生之前的可能性。通过开发一类宽泛的、高效的近似技术,对顺序模型中的边缘化进行建模。这些技术仅依赖于对预先训练的自回归模型的下一步条件分布的访问和采样,包括 - 评估 VLMs 用于基于分数的、多探针注释三维物体
我们提出了一种方法来边际化通过 VLM 查询变化的任何因素,利用采样响应的 VLM 分数。我们展示了这种概率整合可以在摘要中胜过语言模型(如 GPT4),避免了在响应之间存在对比细节时的幻觉。此外,我们展示了聚合注释对于 Prompt-Ch - ACL你需要在可能的 tokenization 上做边缘化吗?
本文研究自回归语言模型中计算字符序列概率的方法,提出了一种基于重要性采样的算法估计边缘概率,并在一系列尖端模型和数据集上进行比较,结果表明在大多数情况下,对边缘化的忽略导致的对数似然差异小于 0.5%,但对于长且复杂的数据则更加明显。
- 我完全是我自己”: 以聚焦跨性别和非二元性人的声音来衡量开放式语言生成中的偏差
本文旨在通过研究 TGNB 社区的社会现实,评估其对语言生成技术中存在的性别歧视传统和对 TGNB 身份的伤害,并引入 TANGO 数据集来测量这些歧视。同时,本文还提出了一些具体的解决方案,并呼吁关注性少数群体的需求。
- 不确定多变量系统的推断矩
该文章提出了使用推断矩的一种新范例分析不确定的多变量系统的行为。推断矩可以更好地描述分布对新信息的响应,同时可以应用于改进感知和决策。
- EMNLP使用检索边际化减轻多文档问答中虚阴性情境
本文提出了一种新的参数化集值检索模型,能够处理具有多个文档和无法回答的查询,通过对检索候选项进行边际化,进而降低样本标注噪声带来的影响,并在两个多文档 QA 数据集上取得了最优表现。
- 通过稀疏性高效消除离散和结构化潜变量的影响
本文介绍了一种利用可微稀疏映射的参数化离散分布的训练策略,可在离散(分类或结构化)潜变量的情况下进行精确的边际化,避免了噪声梯度估计器或连续弛豫的需要,并在三个不同的潜变量建模应用场景取得了成功的结果。