- 数据集代表性与下游任务公平
数据集的代表性与分类器公平性之间存在复杂的关系;平衡这两个量需要模型和数据集设计者特别注意。
- 使用成员预言主动学习组合优化
使用成员预测器解决未知线性约束的组合优化问题,以学习和利用替代线性约束的新框架,并通过采样策略和解决 0-1 整数线性规划来选择需要标记的新点,以提高结果的质量。
- KDD缓解人脸合成方法中的偏差的抽样策略
通过对 Flickr Faces HQ 数据集上训练的 StyleGAN2 生成模型进行分析,本文提出了两种采样策略来平衡生成的人脸图像中选择属性的表示,并揭示了针对非常年轻和非常年老年龄组以及女性面孔的随机采样图像分布中出现的偏差。通过在 - 聚类大数据的收敛时间与准确度权衡
研究在大型数据集上 k-means 和 k-median 聚类的理论和实际运行限制,通过快速压缩数据并在压缩表示上进行聚类,提供了有效聚类的理论和实践蓝图。
- 增强本地性动态偏置和采样策略用于上下文自动语音识别
通过分析不同的采样策略和相关性图,本文首先对上下文偏置模块的训练进行了探究。其次,引入了邻居注意力机制来进一步优化上下文偏置的输出,实验结果表明相对于基准模型,在 LibriSpeech 数据集和稀有单词评估上平均相对词错误率提升了 25. - 梯度和不确定性增强的全局拟合序贯抽样
提出了一种新的全局适应抽样策略,称为梯度和不确定性增强的顺序抽样(GUESS),该策略在该研究中与其他 9 种自适应抽样策略进行了比较,结果表明 GUESS 在测试样例上相比其他基于代理模型的策略具有最高的样本效率。
- 弱标签学习中负采样的重要性
通过研究负样本实例的选择策略,本文提出了几种采样策略,可以有效提升弱标签学习的性能,降低计算成本,并证明负样本并非完全无关,明智地选择负样本有助于弱标签学习。
- 干涉式卫星孔径雷达的扩散模型
利用概率扩散模型生成复杂且真实结构的雷达卫星图像数据集,但采样时间仍然是一个问题。
- 自对比图扩散网络
我们提出了一种名为 Self-Contrastive Graph Diffusion Network(SCGDN)的新框架,其中包含 Attentional Module 和 Diffusion Module 两个主要组件,以实现高效的嵌入 - ICML针对任务的治疗效果估计实验设计
通过任务特定的实验设计和推导到定制特定下游应用程序的采样策略,我们提出了一种更节省样本数据的替代随机对照试验的方法,用于因果推断,并在各种重要任务,实际数据集和样本大小的情况下,胜过其他基准,例如需要一种数量级的数据才能在定向营销任务中达到 - MEET: 一种用于缓冲区采样的 Monte Carlo 探索 - 利用权衡算法
本文提出了一种新的采样策略,基于 Q 值函数的不确定性估计,指导采样探索更重要的转移,从而学习到更有效的策略,实验表明,在各种环境下,该方法在收敛和峰值性能方面的表现平均超过现有策略 26%。
- ECCV主动点级监督实例分割
本文提出了一种名为主动点监督实例分割 (APIS) 的经济型主动学习方案,它通过使用基于框注释的监督,并迭代地对框内的点进行采样和标注,找到最理想的点来最大化分割准确性并以有限的注释预算对模型进行训练。结果表明,APIS 是一种有效的学习范 - 利用进化采样缓解 PINNs 中的传播故障
本文提出了一种新的物理信息神经网络故障模式的解释方式,并从采样策略的角度解释了其失败模式。此外,作者还提出了一种新的演化抽样方法,可以有效地缓解此类问题。
- 低预算主动学习的简单基线
本篇研究利用自我监督学习方法提取丰富特征,并研究了针对低标记预算下不同采样策略的有效性,表明虽然主流主动学习方法在高标记预算下表现出色,但简单的 K 均值聚类方法在低预算下可以胜任,并可作为图像分类低预算主动学习的基线方法。
- 从半结构化表格中生成样例,赋予语言模型推理技能
本文提出了一种基于预训练的方法,通过利用半结构化表格自动生成问题 - 段落对,以检验模型的推理能力,并且通过采样策略来提高模型训练的效率,在三个涉及推理的阅读理解数据集上证明了我们的模型相比于现有流行模型 T5 表现更优。
- CVPRPADS:面向视觉相似度学习的策略适应采样
本文提出了一种基于强化学习的自适应采样策略,根据当前学习状态调整采样分布,能够大幅提高三元组损失训练框架的性能。
- Siamese 网络中的采样策略用于无监督语音表示学习
本文研究了映射网络的采样策略对提高同构词对比学习性能的影响,并发现以 Zipf 定律、发音人分布和同 / 异比例为依据的采样策略可以提高学习 performance,并在无监督地使用发现的同异词对上获得了领先水平的表现。
- KDD神经网络协同过滤的采样策略
本论文提出了一种基于神经网络的推荐框架,该框架可以包含用户 - 物品交互信息和多种内容信息,提出了三种新的采样策略来改善框架的训练效率和推荐性能,并对计算成本和收敛性进行了理论分析。
- 图上信号恢复:采样策略的基本限制
本文提出了一种关于新提出的类光滑图信号的恢复方法,该方法可以在三种采样策略下实现,通过实验设计采样和计算出最大风险下的极小值下限,提出了一种恢复策略来比较不同采样策略带来的误差,并找到了一种最佳的恢复速率。
- 图上的信号:不确定性原理与采样
本研究提出了一类集中在图形域和图形对偶上的图形信号,并基于此提出了图形信号的不确定性原理,探讨了从样本子集中恢复带限信号的条件和提出了替代信号恢复算法,包括基于帧的重构方法,同时提出了几种替代采样策略和相关的条件和反演方法,最后展示了完美恢