位置：机器学习中接受负面结果

Jun, 2024

Position: Embracing Negative Results in Machine Learning

Florian Karl, Lukas Malte Kemeter, Gabriel Dax, Paulina Sierak

TL;DR机器学习方法、预测性能、负面结果、效率低下、科学产出

Abstract

Publications proposing novel machine learning methods are often primarily rated by exhibited predictive performance on selected problems. In this position paper we argue that →

machine learning methods predictive performance negative results inefficiencies scientific output

发现论文，激发创造

科学论文中的立场检测：我们最近变得更消极了吗？

本研究分析了 35 年来自然语言处理和机器学习中论文的状态，将其分类为正面态度和负面态度，利用 SciBERT 训练了一个模型来预测论文的态度，并发现近年来负面态度的论文数量增加，而且更具有影响力。

Feb, 2022

机器学习研究中编码的价值观

通过研究高度引用的机器学习论文，本文发现只有少数论文能够说明其与社会需要的联系，而且更少讨论负面潜力。同时，本文还发现，机器学习研究中经常突出强调的几个价值观，如性能、泛化、量化证据、效率、建立在过去的工作基础之上和创新性等，往往在支持权力集中方面存在着假设和影响。最后，作者发现高度引用的论文越来越多地与科技公司和精英大学有着紧密的联系。

Jun, 2021

展示你的工作并不总是有效的

本文批判性地研究了题为《Show Your Work: Improved Reporting of Experimental Results》的一篇论文，其中提到的评估指标存在偏差和使用错误假设，我们提出了一种无偏的替代方法，并通过统计模拟获得了实证证据。

Apr, 2020

揭开机器学习驱动科学中的过度乐观和出版偏见

通过研究机器学习中的数据泄露和出版偏见等因素，本研究提出了一种新颖的随机模型来估计真实准确性，并纠正了过度乐观的诊断结果，从而提供了更真实的机器学习性能评估。

May, 2024

机器学习实证研究的反思：解决实验的认识论和方法论挑战

我们警告人们对机器学习领域的经验研究常常存在着一种不完整的理解，这导致实验结果不可复制、发现不可靠，进而威胁到该领域的进展。为了克服这种令人担忧的情况，我们呼吁更多地意识到获得知识的多样性方式以及一些认识论上的限制。特别是，我们认为当前大部分经验机器学习研究实质上是确认性研究，而应该视为探索性研究。

May, 2024

论纸质文献的重要性

机器学习的出版流程存在缺陷，新的出版方式虽有助于提高包容性和教育性，但仅仅更换格式不能解决现有问题。该论文认为，影响机器学习研究可达性的根本原因不在于论文流程，而是出版和研究过程中的问题。本论文探讨了这些问题，并提出了一些潜在的解决方案。

Apr, 2021

定位论文：为何 “射击黑暗” 方法主导推荐系统实践；呼吁摒弃反乌托邦思维

通过质疑传统的反对乌托邦思维，本论文探讨了应用推荐系统、A/B 测试、代理度量、深度学习技术以及奖励优化推荐之间的联系。

Feb, 2024

自我降低风险：报告 NLP 系统失败时需谨慎的原因

研究者应该小心关于自然语言处理技术限制的论断，本文提出了一些研究方向和沟通策略，以避免或驳斥这些论断，并维护领域的可信度。

Oct, 2021

机器学习学术研究中令人担忧的趋势

本文研究机器学习的研究领域，在探讨了机器学习领域中出现的四种不良趋势的同时，提供了对应的解决方法和可能产生不良趋势的原因。

Jul, 2018

AI 研究在更广泛的影响陈述中的表现与后果分析

本文通过对 2020 年 NeurIPS 会议发表的关于算法系统负面影响的声明进行定性主题分析，归纳提取出如何表达影响、影响领域和如何减轻负面影响等主题，旨在对 NeurIPS 会议更好地考虑潜在影响提出建议。

May, 2021