- ACL子集选择的半监督数据编程
本文提出了一种半监督的数据编程范式,使用规则 / 标注函数和半监督损失函数基于特征空间学习联合模型,此外,还研究了在联合半监督数据编程目标之上进行子集选择的模型,并在七个公开数据集上表现显著优于其他状态下的模型。
- 无需查看所有项,从 $k$-DPP 中进行抽样
本论文提出了一种自适应算法用于在大型数据集中编织小型数据集,从而提高 $k$-DPP 采样算法的性能,并确保所生成的样本集合与原始数据集的目标分布相一致。
- ICLR非对称行列式点过程的可扩展学习和 MAP 推断
本文介绍了一种线性复杂度的基于 NDPP 内核分解的学习算法和一个线性复杂度的最大后验概率推断算法,使用这些算法可以更好地进行数据集的子集选择,缩短计算时间,并且提升了预测性能。
- WWW不是所有的特征都是相等的:发现维护预测隐私所需的基本特征
本研究提出了 Cloak 框架,其通过梯度优化方法在输入特征空间中发现功能性预测模型所需的子集,并使用保证效用的常量值抑制其余特征,从而减少机器学习服务中数据泄露和隐私问题。实验结果表明,Cloak 可将输入特征与筛选后的表征之间的互信息降 - 存在隐性偏见情况下的排名干预措施
本研究讨论了设计干预措施的问题,以实现子集选择 - 排序的广义化。我们提出了一系列简单和可解释的约束,并表明它们可以最优地减轻隐性偏见,以及在自然分布的假设下,表现出类似 Rooney Rule 的约束也可以令减少的效用损失性最小。最后,我 - 具有亚线性时间预处理的确定性点过程的精确采样
研究了确定性点过程的复杂性,提出了一个新的采样算法,其中预处理成本为 n*poly (k),采样成本为 poly (k)。
- 线性效用函数的多项式 Logit 老虎机
该论文提出了一种算法 LUMB 来解决使用线性效用 MNL 选择模型的多项式对数拉致问题,证明此算法比以往算法更优,无需考虑候选集大小。
- 带正则的体积抽样岭回归下采样
通过协方差矩阵和预测误差,我们提出了一种选择向量子集的新方法,该方法可以使得使用该子集的岭估计在整个数据集上的平均预测误差具有强大的统计保证,而无需昂贵的标签表。同时,我们对一种联合子抽样过程进行扩展,称之为卷积抽样,并加速迭代过程,以实现 - 结构稳健次模最大化:离线与在线算法
本文提出了鲁棒次模函数最大化及其在结构组合约束下的有效算法,旨在提高对次模优化的建模范围,尤其应用于单个或多个基序,背包以及具有分散鲁棒性的标准约束条件,该算法适用于离线和在线设置,并且在线问题的双标准解决方案具有 sub-linear 的 - 多项逻辑 - 赌博机的汤普森采样
本文研究了一种序贯子集选择问题,并提出了一种基于 Thompson Sampling 算法的适用于多项式逻辑模型选择模型的求解方法,能够在绝大多数情况下获得接近最优水平的收益,并在数字实验中取得有趣的实验结果。
- 受限强凸性意味着弱子模性
通过连接高维度的子集选择和子模块化最大化,提出一种可以直接控制特征数目的贪心算法,将标准设置下的回复保证带入一般客观函数中,并在统计上达到可接受的性能。同时,我们的课题为组合结构的统计学习应用提供了独立的兴趣联系点。
- 关于约束行列式点过程的采样和贪婪 MAP 推理
对于一种新颖的分区约束 DPPs,我们提出了第一个多项式时间的算法,以在约束下准确地从中进行抽样,并发现这种方法比 k-DPPs 和其朴素扩展提供更多的灵活性和多样性。同时,我们通过实验发现,简单的贪心初始化和局部搜索可以提高从 k-DPP - KDD利用随机对选择构建自适应嵌套二叉树集成模型
采用随机配对选择方法来提高分类精度的研究表明,在形成嵌套二分集集合时,该方法的效果优于其他方法,并在所有其他情况下与其他方法持平。
- CVPR基于示例的子集选择视频摘要技术
本文提出了一种基于监督的视频摘要方法,该方法利用人类创建的摘要来进行关键帧的视频摘要,同时实现了基于语义信息的子镜头摘要,既降低了计算成本,还提供了定义跨越数帧的子镜头的视觉相似性的更灵活方式。在多项基准测试中进行了广泛评估,并在几个场景中 - KDD行列式点过程的低秩因式分解用于推荐
本文介绍了一种使用低秩矩阵分解方法学习 DPP 核并实现商品推荐预测计算的新方法,比先前方法快近一个数量级,在多项真实数据集上得到了验证和比较结果。
- 多属性比例代表制
探讨预定义集合中选择子集的问题,通过属性向量及其期望分布来确定应选择的子集,研究子集选择规则及计算复杂性。应用包括代表委员会的成员选择,单属性问题称为政党比例代表制中的划分问题。
- 基于现代优化视角的最佳子集选择
本文提出了一种基于混合整数规划的方法来解决最佳子集选择问题,旨在通过离散优化方法扩展现有的一阶连续优化算法,为线性回归提供更高质量的可行解,并延伸到最小绝对偏差损失函数,最终实验证明本文的方法在求解 $n$ 为 1000s 和 $p$ 为 - 应用于变点检测的行列式点过程块状 MAP 推断
本文介绍了一种新的 DPP 类别,即几乎分块对角线协方差矩阵的 BwDPP,该 DPP 类别允许高效的分块 MAP 推断,并成功应用于解决变点检测问题(CPD),即 BwDppCpd 方法,通过 DPP 集合选择估计最终的变点,这种方法在五 - 10,000 + 次加速的稳健子集选择(ARSS)
提出加速鲁棒子集选择方法(ARSS),以防止大误差对目标的影响,并通过 ALM 和等价推导降低计算成本,从而在实验中证明方法的有效性。
- 基于不相似性的稀疏子集选择
本文提出了一种在计算机视觉、生物 / 健康信息学及图像和自然语言处理等领域中集合选择问题的求解方法,通过行稀疏的迹最小化问题的凸松弛,找到代表样本集,并赋予目标集合中的每个元素到代表样本的分配,实现集群化,并通过交替方向乘法法(ADMM)框