EEVEE: 一款简易的自然语言处理标注工具
提供一款可定制的注释系统 ——EASE,使用多任务主动学习、基于人口统计特征的主动学习和查询大型语言模型的提示系统作为多个后端选项,可以满足自然语言处理研究人员的多样化需求,并显著加速注释过程。
May, 2023
MEGAnno 是为 NLP 研究人员和从业者设计的新型探索性注释框架,它不仅仅支持数据标注,还支持数据探索和模型开发,并通过高级搜索和自动建议功能以及在同一笔记本中交互式排序、过滤和分配标签的小部件,实现了灵活、高效、无缝的标注体验。
Jan, 2023
提出了一种新的跨语言的事件抽取数据集,称为 MEE,其中注释了 8 种具有不同语言类型的语言中的 50000 多个实体提及、事件触发和事件参数。在此数据集上进行的实验发现多语言事件抽取的挑战和机遇。
Nov, 2022
本文介绍了一种基于终端的轻量级标注工具,支持不同尺度和类型的标注,具有易于定制的键绑定和 Unicode 支持,通过用户研究与其他工具相比使用安装均更为便捷,并已成功地应用于两个语料库的标注,填补了存在的需求空缺。
Jul, 2019
本文重新实现并评估了 18 种检测可能存在的注释错误的方法,并在 9 个英文数据集上进行了评估,同时提供了评估协议和实现的开源软件包,以促进未来的研究和再现性。
Jun, 2022
该篇论文介绍了一个基于 LightTag 的文本标注工具,其设计和构建基于优化全局 NLP 流程的生产力而非个体标注员的生产效率,并讨论了数据建模和用户界面等方面的决策如何为整个 NLP 生命周期服务。
Sep, 2021
该研究论文介绍了 Antarlekhaka,一种用于手动注释与自然语言处理(NLP)相关任务的综合工具。该工具支持分布式注释,适用于不同语言,并具备用户友好界面和广泛的 NLP 任务注释功能。
Oct, 2023
本研究介绍了 e-ViL 和 e-SNLI-VE 为可解释的视觉语言任务建立了一个统一的评估框架。该任务旨在生成自然语言解释,并涉及四个模型和三个数据集。研究人员还提出了一种新模型,该模型结合了 UNITER 和 GPT-2,对所有数据集的现有技术水平取得了很大的突破。
May, 2021
本文分析了在 42 种语言和三个任务(问答,命名实体识别,事件抽取)上,将标注数据转换为多种语言的效果以及不同的标签投影方法,发现名为 EasyProject 的 mark-then-translate 方法在保留标签跨度边界后具有比基于单词对齐的方法更好的性能。
Nov, 2022