- 动态类损失用于多器官 3D 分割的运行时冻结
我们提出了基于动态类别的损失策略来缓解高度不平衡的训练数据对分割性能的影响,通过我们的方法在具有挑战性的多类别三维腹部器官数据集上改善了分割性能。
- 预处理的重要性:一种用于 WSI 分类的片段搜索方法
经过预处理,全幻灯片图像对分类性能有影响,我们的研究通过分析单领域和多领域数据集上预处理参数对推断和训练的影响,并提出了一种新的基于相似性的模拟退火方法来快速调整参数以提高单领域数据的推断性能,从而在该领域的准确性从 0.512 提高到 0 - CVPR预训练特征在摄像机姿态细化中的非常有效性
将预训练特征与粒子滤波器和可渲染场景表示相结合,实现姿态细化的简单方法达到了最先进的结果,证明不需要特定的训练即可构建姿态细化器。
- FairRR:通过随机响应进行群体公平的预处理
在机器学习模型在决策过程中的不断增加使用中,研究这些系统的公平性已经在不断推进。尽管在入处理和后处理设置中已经进行了大量工作来研究群体公平性,但在预处理领域,这些结果与理论上的联系还很少。本文将在随机响应框架中的响应变量修改下进行下游模型的 - Salsa Fresca: 基于角嵌入和预训练的 ML 反向攻击
使用三种关键方法:更好的预处理、角度嵌入和模型预训练,以提高对 LWE 的机器学习攻击,加速预处理 25 倍,提高模型样本效率 10 倍,并首次证明预训练改进和降低了对 LWE 的机器学习攻击的成本。
- KDD基于工业规模数据的建模表格数据的 Transformers 的比较分析
通过对工业规模数据集的比较分析,本研究旨在解决高维数据处理、范畴和数值特征的高效预处理以及计算需求等问题,并提供了关于数据预处理、预训练和直接监督学习方法的比较,以及管理计算资源和性能之间的权衡策略。着重于金融时间序列数据建模,旨在促进变压 - 机器学习中心电信号处理的最佳实践探索
应用下采样、归一化和滤波等方法,对不同的多标签心电图数据集进行处理,评估其对不同高性能时间序列分类器的影响,并发现低至 50Hz 的采样率可以产生可比较的结果。此外,除了样本率降低可以可靠地减少计算资源,但不会增加准确性以外,我们还发现最小 - 公平 WASP:快速和最优公平 Wasserstein 预处理
我们提出了一种名为 FairWASP 的新预处理方法,通过返回样本级权重来减少分类数据集中的差异,实现了优化算法的竞争性性能,它能在维持准确性的同时降低差异。
- 基于自适应阈值和反向传播神经网络的宇宙物体检测和分割
基于自适应阈值分割方法和反向传播神经网络的天体物体检测,采用了一系列预处理步骤以增强分割和检测。
- 基于深度学习算子求解成像反问题中的歧义性
本文提出了几种方法来提高基于深度学习的图像去模糊的稳定性,包括使用小型神经模型和引入预处理步骤。数值实验证实了这些方法的精度和稳定性,尤其是基于模型的框架在视觉精度和鲁棒性之间提供了最可靠的平衡。
- 基于 Shapley 值的算法公平性数据重新加权方法 FairShap
本文提出了一种新颖且可解释的预处理方法 FairShap,用于通过数据估值实现公平的算法决策。FairShap 基于 Shapley Value 框架,并通过测量每个训练数据点对预定义公平度量的贡献来实现可解释性。我们在多个不同性质、不同训 - 关联规则挖掘的可视化方法综述:分类、挑战、未解之谜和未来思路
该文为关联规则挖掘领域的文献综述,介绍了该领域主要的技术和应用,并旨在定义未来研究方向。
- 基于困惑度的跨语言异构 Web 数据成人和有害内容检测方法
本文探讨检测多语言异构 Web 数据中成人和有害内容的不同方法,利用 perplexity 方法训练文本数据分类器可以使具有相似特征的文档聚合成不同的组群,从而实现更精确的分类。
- CVPR后处理时间性行为检测
本研究旨在解决现有时间序列动作检测算法常常在预处理阶段对视频进行下采样和采样恢复所带来的时间量化误差问题,并介绍了一种新的基于高斯分布的模型无关的后处理方法,称为 Gaussian Approximated Post-processing - 公平映射
为了解决模型中存在的错误偏见,本研究提出了一种新的预处理方法 - 公平映射,通过转换敏感组的数据分布到一个特定的目标分布上,并且实现保护敏感属性不被推论的目标来改善数据的公平性。实验结果表明,该方法能够同时隐蔽敏感属性,不失数据的特性,同时 - 基于文本因果推断中的治疗泄漏概念化
本文介绍了通过「文本蒸馏」预处理方法来控制文字信息偏差的研究,以及如何缓解治疗相关信号对研究结果的影响。
- MM大写字母和标点恢复:一项调查
本文调查了历史和最新的技术,针对文本来源中缺失标点符号和大小写的情况,进行了恢复和矫正。此外,还探讨了当前的挑战和研究方向。
- 神经代码摘要评估
本文采用系统性和深入分析方法,分析了 5 种最先进的神经代码自动摘要模型在 6 种广泛使用的 BLEU 变量、4 种预处理操作及其组合以及 3 种广泛使用的数据集上的评估结果,发现评估代码摘要模型的三个主要因素 ——BLEU 评估指标、代码 - CVPR交通异常检测的良好实践和强基准线
本研究通过预处理、动态跟踪模块和后处理等环节,提出了一种简单而高效的交通异常检测方案,该方案使用视频稳定、背景建模和车辆检测等技术,能够快速精准地识别出交通异常点,在 NVIDIA AI CITY 2021 排行榜中名列第一。
- 机器学习中的公平性:一项调查
这篇文章介绍了机器学习中的社会偏见和公平性问题,总结了预处理、处理和后处理等多种方法,包含二分类、回归、推荐系统、无监督学习和自然语言处理等多个方面,同时提供了多个开源库。最后,列举了公平性研究的四个难题。