SLATE 使用序列标注方法从自由文本中提取任务,可用于数字手写笔记。该方法可以同时执行句子分割和分类,并在任务 / 非任务句子之间进行划分。该方法相较于基线模型 (outperforms a baseline),任务 F1 得分为 84.4%,句子分割得分(边界相似性)为 88.4%。此外,该研究提供了应对数字手写领域中进行自然语言处理的挑战的见解,并提供了代码和数据集。
Nov, 2022
该篇论文介绍了一个基于 LightTag 的文本标注工具,其设计和构建基于优化全局 NLP 流程的生产力而非个体标注员的生产效率,并讨论了数据建模和用户界面等方面的决策如何为整个 NLP 生命周期服务。
Sep, 2021
POTATO 是一个免费的,完全开源的文本注释工具,支持标记多种类型文本和多模态数据,旨在提高标注速度,提供方便的模板和自定义的特性。
Dec, 2022
EEVEE 是一种专注于简便性、效率和易用性的标注工具,可以直接在浏览器中运行,并使用制表符分隔的文件进行标注,支持多任务标注和四种任务类型。
Feb, 2024
介绍了一种轻量级的注释工具 ——Data AnnotatoR Tool (DART),用于标记分层结构数据。通过使用后端序列到序列模型,该系统可以迭代地分析注释标签以更好地对未标记数据进行采样。在模拟实验中,DART 显示了其在标记大量结构化数据、减少注释总数以及自动建议相关标签等方面的优越性能。
Oct, 2020
本文介绍了一种新的基于 Web 的文本注释软件工具 Text Annotation Graphs,它能够提供表示复杂文本之间关系的功能,其特点在于定义和可视化关系本身之间的关系(语义超图),并介绍了使用注释子图或语义摘要来显示文本本身顺序上下文之外的关系,该软件可被广泛应用于任何领域的注释任务。
Nov, 2017
提供一款可定制的注释系统 ——EASE,使用多任务主动学习、基于人口统计特征的主动学习和查询大型语言模型的提示系统作为多个后端选项,可以满足自然语言处理研究人员的多样化需求,并显著加速注释过程。
May, 2023
本研究介绍了一种名为 SciAnnotate 的科学注释工具,可用于标注 NER 任务中的弱标签,并且提供了多个用户友好接口进行弱标签创建。我们使用多源弱标签去噪作为例,并使用 Bertifying 条件隐马尔可夫模型对弱标签进行去噪,评估结果表明使用 SciAnnotate 的弱标签去噪方法可在减少标注时间的同时提高模型召回率。
Aug, 2022
本文提出了一种基于在上下文学习的策略,通过选择少量有代表性的例子来进行标注,进而为新的自然语言任务创建数据集,并证明了此方法在不同场景下都具有良好的效果。
Sep, 2022
介绍了一种轻量级高效的开源文本标注工具 Yedda,可以通过命令行和快捷键快速实现文本实体标注,并通过智能推荐减少标注时间。