- 贝叶斯迁移学习中扁平后验至关重要
我们提出了一种基于概率神经网络和贝叶斯传递学习的锐度感知贝叶斯模型平均方法,通过寻找平的极小值来提高模型的泛化性能。
- 探索多视角像素对比度的通用和鲁棒图像伪造定位
提出了一种多视角像素对比算法(MPC)来进行图像伪造定位,通过预训练主干网络和微调定位头,增强像素定位器,并在不同规模的训练数据集上进行广泛实验证明该方法具有更高的泛化性能和对后期处理的鲁棒性。
- GROD:利用外部分布检测增强 Transformer 的泛化性能
基于 OOD 检测的 Generate Rounded OOD Data (GROD) 算法通过惩罚 OOD 数据的错误分类和生成合成异常值来增强 Transformer 网络在各种任务上的泛化性能,并在不同数据类型的 NLP 和 CV 中 - 融合和混洗全局和局部视角的基于 IMUs 的跨用户人体活动识别的 FLOW
基于惯性测量单元的人体活动识别模型存在用户间数据分布差异大的问题,本研究基于 IMU 数据特征提取了全局视角表示法,有效减轻了不同穿戴风格引起的数据分布差异,并通过多视角监督网络实现了局部视角和全局视角数据的有效融合,实验结果表明该方法在用 - 随机重启以克服标签噪声导致的神经网络过拟合
重启训练在含有噪声标签的深度神经网络中显著提高泛化性能,通过近似随机梯度下降动力学为朗之万动力学,我们理论上证明了重启可以在批量大小和损坏数据比例增加时提供巨大改进。同时,我们实验证实了我们的理论,证明了通过重启可以显著改善性能,并且我们的 - 无维度确定性随机特征回归的等效
我们研究了随机特征岭回归(RFRR)的泛化性能,并提供了其测试误差的一般确定性等价物。具体而言,在一定的集中性质下,我们表明测试误差可以用一个闭式表达式来良好近似,该表达式仅依赖于特征映射的特征值。值得注意的是,我们的近似保证是非渐近的、乘 - 重组重采样划分能够改善超参数优化的普适性
超参数优化中,通过重新划分训练和验证数据集可以提高模型的泛化性能并降低计算成本。
- 扰动梯度以缓解元过拟合
通过增加任务的多样性和降低模型对某些任务的置信度,本论文提出了解决元过拟合问题的几种方法,并在少样本学习环境中展示出了改进的泛化性能。
- 跨领域音视频欺诈检测的基准测试
通过使用跨领域基准测试,提出了一种多模态特征的注意力混合方法,用于改进自动欺骗检测的性能。
- 深度 ReLU 网络的度量学习和相似性学习的泛化分析
我们通过利用真实度量(目标函数)的特定结构,构建了一个近似真实度量的结构化深层 ReLU 神经网络,从而研究了度量和相似性学习的泛化性能,推导了度量和相似性学习问题的过度泛化误差界限,并通过仔细估计逼近误差和估计误差,得出了一个最佳的过度风 - CVPR超越捷径:通过神经坍缩的视角进行无偏学习
本文探讨了神经塌缩(Neural Collapse)现象在不平衡属性的偏倚数据集中的影响,提出了一种避免捷径学习的框架,通过设计神经塌缩结构的快捷方式引导模型,以捕捉内在的相关性,从而解决了偏倚分类的根本原因,实验证明该方法在训练过程中具有 - SemVecNet: 任意传感器配置的可推广向量地图生成
我们提出了一种用于自动驾驶中向量地图生成的模块化流水线,通过采用鲁棒的俯视语义地图,并利用 MapTRv2 解码器将其转换为向量地图,从而显著提高了模型的泛化性能。在未经训练的传感器配置数据集上进行的评估结果表明,我们的模型泛化能力明显优于 - 充分利用数据:改变训练数据分布以提高内分布泛化性能
我们通过比较梯度下降(GD)和锐度感知最小化(SAM)的归纳偏差,证明了 SAM 在早期阶段更均匀地学习易于和困难的特征,因此我们提出了一种基于网络输出的示例聚类算法并上采样那些没有易于特征的示例,从而改善了原始数据分布上(S)GD 的泛化 - IJCAI超参数优化在离策略学习中甚至可能是有害的及其应对方法
基于偏置记录数据准确估计反事实政策效果的评估在许多情况下不仅用于评估决策政策的价值,还用于搜索大候选空间中的最佳超参数。本研究探讨了离策略学习中的超参数优化任务,并提出了简单而高效的校正方法来解决相关问题。实证调查证明了我们提出的超参数优化 - AED-PADA: 通过主要对抗领域适应性提高对抗样本检测的泛化能力
通过主对抗领域适应的对抗性样例检测方法(AED-PADA),针对现有检测方法在广泛应用中存在的泛化性能较差的问题提出了解决方案,通过识别主对抗领域(PAD)并利用多源领域适应实现对对抗性样例的检测,实验表明我们的方法在具有极小幅度干扰的挑战 - 自由对抗性训练中的稳定性和泛化能力
通过算法稳定性框架研究了对抗性训练方法的泛化性能,发现自由对抗性训练方法具有较低的训练和测试样本之间的泛化差距,并且具有更好的鲁棒性对抗黑盒攻击。
- ACL缓解上下文记忆以提高开放领域问答的泛化能力
Open-domain Question Answering research investigates the generalization performance of a retrieval-augmented QA model, p - CVPR基于网格的神经场模型的归纳增强
该论文介绍了一种基于网格的模型的理论框架,并提出了一种名为 MulFAGrid 的新型基于网格的模型,该模型在各种任务中展示了卓越的表征能力和较低的泛化性能。
- CVPR基于 Fisher-Rao 范式的正则化提升对抗训练
以模型复杂性为视角解决对抗训练中标准泛化性能的下降问题,通过使用 Logit-Oriented Adversarial Training (LOAT) 提出了一种新的正则化框架,可以在几乎不增加计算开销的情况下平衡鲁棒性与准确性,提高对抗性 - DomainLab:一种用于深度学习领域泛化的模块化 Python 软件包
深度神经网络的信任部署经常受到未知领域分布偏移引起的泛化性能差的影响。DomainLab 是一个模块化的 Python 包,用于训练用户指定的神经网络,并具有可组合的正则化损失项。