度量学习的现实检验

Mar, 2020

A Metric Learning Reality Check

Kevin Musgrave, Serge Belongie, Ser-Nam Lim

TL;DR本文研究过去四年深度度量学习领域的论文，发现其中许多论文实验方法存在缺陷，显示出时间上的改进最好只是微不足道的。

Abstract

deep metric learning papers from the past four years have consistently claimed great advances in accuracy, often more than doubling the performance of decade-old methods. In this paper, we take a closer look at t

deep metric learning accuracy experimental methodology improvements marginal

发现论文，激发创造

揭开机器学习驱动科学中的过度乐观和出版偏见

通过研究机器学习中的数据泄露和出版偏见等因素，本研究提出了一种新颖的随机模型来估计真实准确性，并纠正了过度乐观的诊断结果，从而提供了更真实的机器学习性能评估。

May, 2024

度量学习的鲁棒性和泛化性

本文介绍了一种算法鲁棒性的概念来推导度量学习的泛化界限，并且证明了弱稳健性是度量学习算法泛化的必要且充分条件，从而扩展了现有度量学习算法的泛化结果。

Sep, 2012

深度元学习综述

本论文旨在提供关于 Deep Meta-Learning 的理论基础以及总结关键的度量、模型和优化技术，同时也指出了性能评估和计算成本等主要挑战。

Oct, 2020

走向持续学习的工业应用：类增量学习的新度量提案

本研究通过实验证明了现有的基于任务准确率的持续学习性能度量方法的局限性，并提出了一个公平且更有用的评估指标 Minimal Incremental Class Accuracy（MICA），以及一个综合考虑学习性能变化的单一标量度量方法。

Apr, 2024

度量学习用于对抗性鲁棒性

通过对 PGD 攻击下的深度表示的实证分析，我们发现攻击会导致内部表示向 “误分类” 类别移动。基于此观察，我们提出了使用度量学习来规范攻击下的表示空间，从而产生更强健的分类器。通过精心抽样度量学习实例，我们的学习表示不仅提高了鲁棒性，还可以检测先前未见过的对抗性样本。量化实验表明，相对于以前的工作，我们的方法使得鲁棒性准确度提高了 4％，检测效率提高了 6％。

Sep, 2019

度量迷宫导航：调和分数幅度和准确性

本文研究了现代测量方法的 “动态范围”，旨在提供有关分数差异的集体理解，包括在测量之间以及内部分数之间的意义，即我们问对于人类来说，系统之间需要多大的指标差异 X 才能被注意到。我们在一个新的大型数据集 ToShip23 上进行评估，使用该数据集发现了在评估指标达到对人类有意义的系统级差异时的差值，我们通过成对系统准确性来衡量这种差异。在数据量允许的情况下，我们还探讨了指标差异和准确性对于更细粒度特征的影响，例如翻译方向、领域和系统接近程度。

Jan, 2024

Few-shot 学习的元学习方法：最新进展综述

该论文介绍了元学习在深度学习中的应用及其近期发展，涵盖度量、记忆、基于学习等方法，并探讨了当前的挑战和未来的研究方向。

Mar, 2023

深度度量学习中训练策略和泛化性能的重访

本文通过对深度度量学习算法的客观比较研究，发现了深度度量学习算法饱和度高于文献中表明的水平，并揭示了嵌入空间密度与模型泛化性能之间的相关性，并提出了一种简单有效的训练正则化方法来提高基于排名的深度度量学习模型的性能。

Feb, 2020

基于校准然后计算的深度点击率预测模型中减少方差的度量框架

通过减少方差提高准确性，我们提出了一种新的指标框架 —— 校准损失指标，以解决深度学习管道评估过程中的度量方差问题，并通过在深度点击率预测模型中的理论论证和大量实验验证支持我们的方法。

Jan, 2024

机器翻译研究的科学可信度：769 篇论文的元评估

本文是机器翻译评估的第一篇大规模元评估，发现了在过去十年中自动 MT 评估的做法已经发生了巨大的变化和令人担忧的趋势。我们提出了指南来鼓励更好的自动 MT 评估，并提出了一个简单的元评估评分方法来评估其可靠性。

Jun, 2021