自然语言处理研究的预注册讨论

Feb, 2023

A Two-Sided Discussion of Preregistration of NLP Research

Anders Søgaard, Daniel Hershcovich, Miryam de Lhoneux

TL;DRVan Miltenburg等人(2021)建议采用预先注册以防止钓鱼式探索和促进负面结果的发表。我们讨论了其利弊，例如可能会增加发表偏见、p-hacking等问题。

Abstract

Van Miltenburg et al. (2021) suggest nlp research should adopt preregistration to prevent fishing expeditions and to promote publication of negative results. At face value, this is a very reasonable suggestion, s

发现论文，激发创造

并非所有断言都是平等的：选择正确的统计方法评估假设

该论文探讨了自然语言处理中假设评估的问题，提出使用贝叶斯方法评估假设，并提供了针对该领域的最佳实践和指南。

Nov, 2019

NLP 研究的预注册

本篇论文讨论了预注册在自然语言处理(NLP)研究中的应用，提出了不同类型研究的预注册问题和支持基于注册报告的慢科学。旨在引发NLP学术界的讨论，并为未来研究综合成一般性的NLP预注册表单。

Mar, 2021

自然语言处理可重现性研究的系统综述

研究了自然语言处理领域内可重复性的困境，探索了不同声音和共通点。

Mar, 2021

自我降低风险：报告NLP系统失败时需谨慎的原因

研究者应该小心关于自然语言处理技术限制的论断，本文提出了一些研究方向和沟通策略，以避免或驳斥这些论断，并维护领域的可信度。

Oct, 2021

探究自然语言处理中的双重用途困境

本文旨在通过调查自然语言处理（NLP）研究人员和从业者的意见来理解双重用途问题，并提出适用于NLP社群需求的双重用途定义。该调查揭示了大多数研究人员关注研究的潜在双重用途，但仅采取有限行动。最后, 我们提出了一个可集成到现有会议伦理框架(如ACL伦理检查)中的检查清单，以减轻NLP中的双重用途问题。

Apr, 2023

NLP中无法评估先前人类评估的再现性：信息缺失，作者不响应，实验缺陷

该研究为了检查人类对NLP的评估是否可重复进行了集体研究，结果发现大多数近期的研究不可重复、不可复制，需要重新设计并报告人类对NLP的评估方式。

May, 2023

面向所有人的NLP可重复性:理解初学者的经历

本文为了解当下自然语言处理领域新手对当前研究重复性工作的需求，对93名introductory NLP课程学生开展了研究。结果表明，编程技能和对研究论文的理解与其完成任务的时间无明显相关性，而研究作者开源工作的可访问性、文档完整性、良好编程规范和易于获取数据文件等均对成功至关重要。此外，作者建议自然语言处理研究者关注这些简单但关键的方面并充分利用初学者的反馈来提供更好的支持和改进。

May, 2023

自然语言处理中的可重复性：清单告诉我们了什么？

本文通过分析NLP可重复性核对清单，发现清单的发布提升了NLP论文关于效率、验证性能、汇总统计和超参数等关键信息的披露率，且论文被接受的概率与符合要求的回复量呈正相关，同时提出了未来会议的一系列改进建议。

Jun, 2023

调查（不）平衡和计算机密集型自然语言处理研究的问题

本文通过一项针对312名NLP群体成员的调查，对当前自然语言处理中在环境影响、公平性等三个方面所引起问题的现状与成因进行了分析，并提出了一些缓解措施。

Jun, 2023

ReproHum #0087-01: 生成事实检查解释的人工评估复现报告

这篇论文通过ReproHum元素，部分复现了Anatanasova等人（2020）的《生成事实检查解释》。在ReproNLP共同任务中，本共享任务旨在研究NLP作为一个领域在时间上变得更加可复现的程度。通过根据任务组织者和原始作者提供的指南，我们对40个输入的3个事实检查解释（包括一个黄金标准和两个模型的输出）进行了相对排名，评估了其覆盖范围。我们的复现和对原始结果的再分析结果支持原论文的发现，原始论文与我们的复现结果之间存在类似的模式。尽管我们观察到与原始结果略有不同的变化，但我们的发现支持原始作者关于其提出的模型的有效性的主要结论。

Apr, 2024