- ICML通过分布扰动分析进行稳定性评估
通过分析数据集的分布扰动来评估学习模型的稳定性,利用最优输运法来量化该扰动,从而解决现实场景中常见的数据损坏和子集群转移两种分布转移类型问题,同时提供了可行的凸优化问题和计算方法以实现实际应用的价值。
- 描述拓扑对图学习任务的影响
该研究提出了一种度量指标 TopoInf,用于衡量图的拓扑结构对下游任务的影响,并通过上下文随机块模型的解耦 GNN 进行分析,证明了该度量指标的有效性。通过大量实验证明 TopoInf 是衡量拓扑影响的有效度量,并可进一步用于增强图学习。
- 语言导向的医学图像分割的跨模态条件重构
提出一种新的跨模态条件重构来从事以语言指导的医学图像分割,并通过实验证明了其在不同数据集上的优越性能
- 分类应用中衡量数据质量的新度量方法(扩展版本)
介绍并解释一种基于分类性能和数据退化的相关演变来度量数据质量的新指标,该方法具有模型无关性,并通过大量的数值实验以及具有可控和可解释质量的案例详细验证了所提出度量标准的实用性。
- 可解释性注意力:适用于少样本学习及其扩展
通过深度强化学习实现硬注意力的概念,直接影响原始输入数据,从而为人类理解提供解释性的硬注意力定位方法。
- 学习量子态复杂度调查
本文综述了学习量子状态的复杂性及其研究,包括量子测量,物理量子状态的学习,替代量子测量模型以及作为量子状态编码的经典函数的学习。总结了这些研究带来的 25 个激动人心的开放性问题,展示了它们为高度成功的理论铺平了道路。
- 利用分位回归和流推断学习驾驶行为分布的尾部分位数
针对自动驾驶(AD)的安全性问题,本文考虑了在与 AD 车辆交互的情况下准确捕捉人类驾驶员行为概率分布的多样性和尾部分位数的学习模型问题,并采用分位数回归和自回归分位数流两种灵活的框架进行了评估。
- KDD物流、图形和变形器:改进旅行时间估计
本文提出基于转换器架构 - TransTTE 的新方法来解决交通运输中旅行时间估计问题。
- 在线广告中的点击率预测:文献综述
本文系统地回顾了 CTR 预测领域的最新研究进展及其建模框架,着重介绍了基础建模框架及其拓展,对其优缺点和预测性能进行了分类总结,并结合各类数据集对不同复杂度和要素相互作用顺序进行了性能比较。同时,本文还识别出当前研究趋势、主要挑战和未来研 - 基于知识图谱的复杂查询回答的组合泛化能力基准测试
本文提出 EFO-1-QA 数据集,包含 301 种不同的查询类型用于评估目前复杂查询回答 (CQA) 学习模型的组合泛化能力,并提供可能影响查询泛化能力的不同操作系统和形式的分析和评估。
- ICLR阶梯多项式神经网络
本文介绍了一种基于乘积构建出的新型激活函数的多项式前向神经网络,其可以被标准训练技术(如批量归一化和丢弃)所训练,并且在回归和分类任务上表现良好,同时具有一些在贝叶斯学习中非常有用的解析计算数量。
- ACLBIGPATENT:大规模的抽象和连贯摘要数据集
本研究提出了一个新的数据集 BIGPATENT,包含了 130 万条美国专利文件及其人工写成的抽象摘要,其中摘要具有更丰富的信息结构和更均匀地分布在原始文件中,且比现有的数据集具有更少和更短的提取片段,在此基础上,我们使用各种学习模型对 B - 自然语言问答的进展:一篇综述
该论文讨论了基于学习模型和深度学习方法的问答系统在处理语言多样性和动态性方面的成功和挑战。
- 基于排名的损失函数的高效优化
提出了一种新的 quicksort-flavored 算法,可以在大量训练数据集上优化非可分离损失函数。已证明,该方法适用于包括 AP 和 NDCG 基础上的损失函数,并且对于我们的方法渐近计算复杂度不能提高。我们展示了该方法在优化结构化铰 - NIPS从随机混合到快速速率
本文讨论了经验风险最小化在统计学习和非统计预测模型中的快速收敛特性,其中针对后者提出了随机混合性概念,并证明了快速收敛条件可以建立在该概念上。