ACL 文献数据库的历时研究:自然语言处理文献的现状
这篇论文介绍了一个名为 “ACL Anthology Helper” 的工具,它自动化解析和下载论文及其元信息,并将其存储在本地 MySQL 数据库中,从而实现了对本地论文的高效管理。该工具提供了 20 多种操作,极大地提升了根据特定条件检索文献的能力,并成功应用于撰写了一篇综述论文。通过引入 ACL Anthology Helper,我们旨在提升研究人员有效访问和组织 ACL Anthology 中的文献的能力,为研究人员在探索 ACL Anthology 庞大的出版物集合时提供了便利的解决方案,并允许更有针对性和高效的文献检索。
Oct, 2023
本文分析了先前的和当前的 NLP 研究中所考虑的伦理方面,通过比较其他学科的研究,比较了 ACL 文集的趋势,发现 NLP 研究中的规范伦理审查正在迅速上升。
Jun, 2021
该报告旨在通过识别与 NLP 和 ML 相关的最受欢迎的论文,为研究者和从业者提供一个快速指南,着重应对信息过载问题和了解当前趋势。最受引用的论文主要涉及 LLM 效率、评估技术、伦理考虑、有身体的机器人和 LLM 的问题解决,其中 NLP 相关论文最为具有影响力。
Jul, 2023
ACL OCL 是一个学术语料库,包含了 74k 篇计算语言学领域的科学论文,210k 个提取的图形,以及针对所有 OCL 论文的主题。该研究观察到语法标注、分块和解析主题明显下降,而自然语言生成主题再次兴盛。
May, 2023
人工智能(AI)领域中,自然语言处理(NLP)、机器学习(ML)和计算机视觉(CV)是主要的研究方向和研究领域,此篇研究报告通过对 arXiv 上最引用的论文的分析,对数据集特征、关键词的流行程度和全球机构的分布进行了研究,发现 NLP 在研究中占主导地位,并且美国在相关论文中占据主导地位,而欧洲在最引用的论文中表现较差。
Dec, 2023
本文通过考察各种语言在 NLP 会议上的代表情况以及它们之间的资源差异等多方面,旨在呼吁 ACL 社区关注当前语言技术和应用中存在的不平等现象,提高关注和支持那些缺乏资源的语言,推动语言技术和多语言交流的发展。
Apr, 2020
通过对 ACL Anthology 中的研究论文进行系统分类和分析,我们提供了自然语言处理领域的研究概况、学科分类,分析了最近的发展,并总结了我们的发现并强调了未来工作的方向。
Jul, 2023
NLP 领域正在经历一系列颠覆性的变化,该研究旨在通过深入了解过去来塑造我们的未来。通过对 26 位 NLP 研究人员进行长篇采访,我们研究了影响 NLP 领域的因素,包括文化、激励和基础设施。我们的访谈对象发现该领域存在循环模式,同时也出现了历史上没有先例的新变化,包括基准文化和软件基础设施的变化。通过对 ACL 文集中的引用、作者和语言使用进行定量分析,我们进一步支持了这一讨论。最后,我们讨论了 NLP 领域未来的共同愿景、关切和希望。我们希望这项对过去和现在的研究能够引发对我们社区内隐含规范的明确讨论,并更加有意识地塑造未来。
Oct, 2023
我们分析了存档在 ACL 文集中的一批 NLP 研究论文,以量化 NLP 社区中的开放程度以及这种开放文化的好处。我们观察到在不同的 NLP 场馆发表的论文显示出与工件重复使用相关的不同模式。同时,我们注意到超过 30% 的我们分析的论文未公开发布其工件,尽管承诺如此。此外,我们观察到与 NLP 相关的公开工件存在广泛的语言差异。
Jun, 2024
自从采用 Transformer 架构以来,自然语言处理(NLP)已经显著发展。Transformers 催生了预训练大型语言模型(PLMs)。在多个任务中,NLP 系统的性能有了巨大提升,有些情况下甚至超过了人类。然而,事实仍然是,在预训练时,更好质量的数据集能够让 PLMs 在各个任务中取得更好的性能。为了满足特定需求,NLP 研究者继续创建新的数据集,而本研究旨在揭示这些数据集中所挖掘的趋势和见解,并向未来有意策划数据集的研究者提供有价值的建议。
Mar, 2024