EEVEE: 一款简易的自然语言处理标注工具

ACLFeb, 2024

EEVEE: 一款简易的自然语言处理标注工具

EEVEE: An Easy Annotation Tool for Natural Language Processing

Axel Sorensen, Siyao Peng, Barbara Plank, Rob van der Goot

TL;DREEVEE 是一种专注于简便性、效率和易用性的标注工具，可以直接在浏览器中运行，并使用制表符分隔的文件进行标注，支持多任务标注和四种任务类型。

Abstract

annotation tools are the starting point for creating Natural Language Processing (NLP) datasets. There is a wide variety of tools available; setting up these tools is however a hindrance. We propose →

annotation tools natural language processing datasets eevee browser-based annotation

发现论文，激发创造

EASE: 一种由效率增强机制驱动的易定制的注释系统

提供一款可定制的注释系统 ——EASE，使用多任务主动学习、基于人口统计特征的主动学习和查询大型语言模型的提示系统作为多个后端选项，可以满足自然语言处理研究人员的多样化需求，并显著加速注释过程。

May, 2023

计算笔记本中 NLP 的探索性标注

MEGAnno 是为 NLP 研究人员和从业者设计的新型探索性注释框架，它不仅仅支持数据标注，还支持数据探索和模型开发，并通过高级搜索和自动建议功能以及在同一笔记本中交互式排序、过滤和分配标签的小部件，实现了灵活、高效、无缝的标注体验。

Jan, 2023

MEE：一份新颖的多语言事件提取数据集

提出了一种新的跨语言的事件抽取数据集，称为 MEE，其中注释了 8 种具有不同语言类型的语言中的 50000 多个实体提及、事件触发和事件参数。在此数据集上进行的实验发现多语言事件抽取的挑战和机遇。

Nov, 2022

SLATE: 一个专业人士专用的超轻量级标注工具

本文介绍了一种基于终端的轻量级标注工具，支持不同尺度和类型的标注，具有易于定制的键绑定和 Unicode 支持，通过用户研究与其他工具相比使用安装均更为便捷，并已成功地应用于两个语料库的标注，填补了存在的需求空缺。

Jul, 2019

注释错误检测：分析过去和现在，创造更连贯的未来

本文重新实现并评估了 18 种检测可能存在的注释错误的方法，并在 9 个英文数据集上进行了评估，同时提供了评估协议和实现的开源软件包，以促进未来的研究和再现性。

Jun, 2022

POTATO：便携式文本注释工具

POTATO 是一个免费的，完全开源的文本注释工具，支持标记多种类型文本和多模态数据，旨在提高标注速度，提供方便的模板和自定义的特性。

Dec, 2022

LightTag：文本标注平台

该篇论文介绍了一个基于 LightTag 的文本标注工具，其设计和构建基于优化全局 NLP 流程的生产力而非个体标注员的生产效率，并讨论了数据建模和用户界面等方面的决策如何为整个 NLP 生命周期服务。

Sep, 2021

Antarlekhaka: 多任务自然语言注释的综合工具

该研究论文介绍了 Antarlekhaka，一种用于手动注释与自然语言处理（NLP）相关任务的综合工具。该工具支持分布式注释，适用于不同语言，并具备用户友好界面和广泛的 NLP 任务注释功能。

Oct, 2023

e-ViL: 视觉语言任务中自然语言解释的数据集和基准测试

本研究介绍了 e-ViL 和 e-SNLI-VE 为可解释的视觉语言任务建立了一个统一的评估框架。该任务旨在生成自然语言解释，并涉及四个模型和三个数据集。研究人员还提出了一种新模型，该模型结合了 UNITER 和 GPT-2，对所有数据集的现有技术水平取得了很大的突破。

May, 2021

跨语言转移的令人沮丧的简单标签投影

本文分析了在 42 种语言和三个任务（问答，命名实体识别，事件抽取）上，将标注数据转换为多种语言的效果以及不同的标签投影方法，发现名为 EasyProject 的 mark-then-translate 方法在保留标签跨度边界后具有比基于单词对齐的方法更好的性能。

Nov, 2022