- Shapley Sets: 通过递归函数分解进行特征归属
本文提出了一种替代 Shapley Value 功能归属的方法,名为 Shapley Sets,通过递归函数分解算法将基础模型分解为非可分离变量组,非常适用于具有复杂依赖结构的数据类型,并与 Shapley Value 具有相同的公平公理。
- 使用依赖树的多项式表示量化语法相似性
引入了一个可以区分树结构的图多项式来表达依存语法,并基于多项式表示引入了一种量化句子语法相似度的方法。通过将这个基于多项式的方法运用到分析并比较不同语言中的句子与其翻译之间的句法以及在已有语料库中进行语法学的类型学研究,最后探讨并展示了这种 - EMNLP通过依存增强预训练模型和自适应融合来提高语义匹配
该论文提出了一种将依赖性结构有效整合到预训练模型中用于更好地建模复杂语义匹配关系的方法,即依赖增强自适应融合注意力方法(DAFA),并将其应用在 BERT 上,在 10 个公共数据集上实现了最先进或具有竞争性的性能。
- 通过问题和回答进行话语分析:解析讨论中问题的依存结构
本文介绍了一种自动语篇处理方法 ——Questions Under Discussion(QUD),采用了一种新的语言框架,通过大数据集训练 QUD 解析器从而可以获得强大的性能,同时通过 QUD 分析可以实现文档简化。
- 深度学习方法的句法归纳偏置
我们在本文中介绍了两种归纳偏差方法,分别针对语法结构和依赖关系,实现了深度学习模型的归纳偏差,并通过这些方法建立了深度学习模型的潜在分层表示,使模型能够处理复杂的序列结构并在语言处理任务中取得了优秀的效果。
- 运用句法依存预测任务提高中文语义错误识别的预训练语言模型
本研究利用 BERT 模型结构和语法相关的预训练任务,构建了一个高质量的基于语言学的中文语义可接受性语料库,并在该数据集上实验,证明本研究方法优于通用预训练模型和语法模型。
- 基于潜在图推理的多元时间序列预测
一种支持多元时间序列预测的灵活模型,可以基于完全联通或双部分图推断时间序列之间的关系,提供高精度或高效率预测并降低时间和内存复杂度。在多个数据集中表现优于之前的图推断方法。
- 多元分位函数预测器
使用多元分位函数预测器(MQF $^2$),结合输入凸神经网络,提出全局概率预测方法,能准确地预测多种时间跨度的数据,并且能够有效地捕捉到时间依赖结构和避免分位数交叉。
- ICLR多源不精确弱监督模型中的依赖结构错误
通过数据编程(DP)的实验,揭示了标记数据的昂贵成本。 DP 使用的标记函数(LF)定位于领域知识,可以带有复杂的依赖性,用于标记一部分数据,并在 LF 随后训练标签模型。标签模型根据 LF 生成对未知分类标签的估计。本文研究了标记模型结构 - ICML从信息理论的角度构建生成模型框架,学习有结构的潜在因子和相关数据
本文提出了一种新的框架来学习具有所需结构属性的多元数据的可控和通用表示,该模型利用图模型中的掩码变量表示归纳偏置,并扩展多元信息瓶颈理论来强制执行结构依赖性,从而提供原则性方法来学习一组语义上有意义的潜在因素,其反映了各种类型的期望结构,如 - 基于注意力图神经网络的多标签文本分类
本文介绍了一种基于图注意力网络的模型,用于捕捉标签之间的关注依赖结构。该模型使用特征矩阵和相关矩阵来探索标签之间的关系,并生成可用于端到端训练的分类器。该模型在 5 个真实的多标签文本分类数据集上表现出与先前的最先进模型相似或更好的性能。
- 跨主体分析:从密集内部图推断稀疏交互
提出一种新的基于高斯图模型的 Inter-Subject Analysis 模型用于研究大脑区域间的功能连接,应用于神经科学领域,可估计和推断不同对象之间的精度矩阵,并在模拟和大脑成像数据上验证了该模型的有效性。
- NIPS已知协方差的组合半赌博算法
介绍了一个基于线性回归的优化算法,用于解决组合随机半汉带问题中的依赖关系,分析证明其是最优的,并且推出了一个与被拉动手臂数的对数因子成比例的新的下界。
- Ising 模型结构中的广义直接变化估计
本文提出了一种基于原子范数的正则化估计器用于直接估计两个 Ising 模型之间依赖结构的变化,仅需要满足样本复杂度要求的一组样本就可以将变化准确地估计出来,并且估计误差会随着样本数的增加而减小。
- 学习具有潜在因素的时间序列的依赖关系图
本文考虑学习基于样本的线性随机微分方程系统的依赖结构,特别是当一些变量是潜在变量时。我们开发了一种基于凸优化的新方法来解决这个问题。针对观测变量之间的依赖关系稀疏的情况,我们理论上建立了结构恢复的高维缩放结果,并通过合成和真实数据(来自股票 - 从样本中重建马尔科夫随机场:一些简单的观察和算法
使用马尔可夫随机场重建算法重建依赖结构,并且在观察到低噪声时可获得高概率的成功率。
- 关于高维重抽样的一些非渐进结果,I:置信域,II:多重检验
本文研究了应用于具有未知依赖关系结构的随机向量均值的广义自助法置信区间,并针对高维向量进行非渐近控制,分别采用了基于浓度原理和基于重新采样分位数量化的方法,并且考虑了蒙特卡罗法的精度问题。