句法基础的观点挖掘中的复制问题

ACLJan, 2017

句法基础的观点挖掘中的复制问题

Replication issues in syntax-based aspect extraction for opinion mining

Edison Marrese-Taylor, Yutaka Matsuo

TL;DR本文介绍了一项对于基于句法的方面级情感挖掘的三种著名算法的经验可重复性研究，表明由于预处理和参数设置缺少细节以及缺乏可用的代码实现以阐明细节，再现结果仍然是一项困难的任务，这是该领域的重要研究威胁。因此，鼓励代码驱动的研究在帮助研究人员更好地理解最新技术意义和生成持续进展方面具有关键作用。

Abstract

Reproducing experiments is an important instrument to validate previous work and build upon existing approaches. It has been tackled numerous times in different areas of science. In this paper, we introduce an empirical replicability study of three well-known algorithms for syntactic centric aspect-based →

reproducibility opinion mining nlp algorithm implementation

发现论文，激发创造

在野外评估基于方面的情感分析的生产可重现性、可复制性及更多

本文通过实践者的角度，对过去 6 年中公布的代表性模型进行了评估，发现评估结果的再现性较差，并对跨领域数据迁移进行了研究，结果表明较少的领域特定数据集能够与同一地区的其他领域数据集结合使用，从而极大地缩小了完全跨领域和完全领域内预测性能之间的差距，并公开了两个大型的印度电子商务评论语料库以促进领域的进一步发展。

Jan, 2021

将复制和复现与 NLP 中的泛化能力联系起来：针对目标依赖性情感分析的三个复现研究

本研究旨在解决自然语言处理中重复性和普适性问题，并以目标相关情感分析为例，证明最近该领域的工作缺乏足够的代码共享和方法描述，缺乏对数据的可比性和泛化性。研究人员运用三种互补方法进行了第一次再现研究，并在六个不同的英文数据集上进行了第一次大规模评估，推荐未来考虑多种数据集、发布代码，以便最大程度上减少使可重复性和普遍性困难的障碍。

Jun, 2018

自然语言处理的可复现性分析：用多个数据集测试意义

该论文提出了一种重复性分析框架，用于对 NLP 任务算法的多个比较进行统计学分析，相对于 NLP 文献中目前未经统计证明的传统做法具有显著的理论优势，并通过多个应用案例展示了其实证价值。

Sep, 2017

NLP 中无法评估先前人类评估的再现性：信息缺失，作者不响应，实验缺陷

该研究为了检查人类对 NLP 的评估是否可重复进行了集体研究，结果发现大多数近期的研究不可重复、不可复制，需要重新设计并报告人类对 NLP 的评估方式。

May, 2023

材料科学中的自复现经验教训

我们的研究对两篇杰出的物质科学文献领域的先驱作品进行了重现性分析：金和安迪的 “氧化物材料机器学习和编码合成参数” 和西托扬的 “无监督词嵌入从物质科学文献中捕捉潜在知识”。我们的研究发现这两篇论文的工作流程严谨，代码可复现，获得了明确的模型评估指导；然而，还存在改进的空间，如尽可能提供训练数据的访问权限，提供更多关于模型架构和训练过程的透明度，以及规定软件依赖版本。

Jul, 2023

可再生性不等于正确性：在自然语言处理中测试代码的重要性

研究表明，代码正确性与结果可重复性应并重，通过一个案例研究，发现并修正了 Conformer 模型中的三个错误，证明了存在缺陷不影响结果的可重复性，同时也呼吁采用编码最佳实践以促进正确性和提高开发软件的质量。

Mar, 2023

引用是否能反映一篇论文的可重复性？机器学习论文案例研究

使用下游引文语境作为可再现性的信号进行情感分析，以解释机器学习复现挑战中复现尝试的积极或消极结果。

May, 2024

面向所有人的 NLP 可重复性：理解初学者的经历

本文为了解当下自然语言处理领域新手对当前研究重复性工作的需求，对 93 名 introductory NLP 课程学生开展了研究。结果表明，编程技能和对研究论文的理解与其完成任务的时间无明显相关性，而研究作者开源工作的可访问性、文档完整性、良好编程规范和易于获取数据文件等均对成功至关重要。此外，作者建议自然语言处理研究者关注这些简单但关键的方面并充分利用初学者的反馈来提供更好的支持和改进。

May, 2023

自然语言处理初学者的再现性经验之外：超越研究界的再现性

通过对 93 名入门 NLP 课程的学生进行实验，研究发现初学者技术水平并不影响他们完成最新 NLP 技术的实验，关键在于研究作者提供易用性的文档和数据集。

May, 2022

自然语言处理可重现性研究的系统综述

研究了自然语言处理领域内可重复性的困境，探索了不同声音和共通点。

Mar, 2021