EASE: 一种由效率增强机制驱动的易定制的注释系统

May, 2023

EASE: 一种由效率增强机制驱动的易定制的注释系统

EASE: An Easily-Customized Annotation System Powered by Efficiency Enhancement Mechanisms

Naihao Deng, Yikai Liu, Mingye Chen, Winston Wu, Siyang Liu...

TL;DR提供一款可定制的注释系统 ——EASE，使用多任务主动学习、基于人口统计特征的主动学习和查询大型语言模型的提示系统作为多个后端选项，可以满足自然语言处理研究人员的多样化需求，并显著加速注释过程。

Abstract

The performance of current supervised ai systems is tightly connected to the availability of annotated datasets. Annotations are usually collected through →

supervised ai systems annotated datasets annotation tools ease active learning mechanisms

发现论文，激发创造

EASE: 实体感知的对比学习句子嵌入

EASE 是一种基于对句子及其相关实体进行对比学习的句子嵌入方法，其利用实体语义作为丰富的训练信号，并提供了跨语言对齐的监督。在单语和多语境下，EASE 表现出竞争力或更好的性能，并在多项任务中明显优于基线方法。

May, 2022

具有深度学习和自然语言能力的辅助图像标注系统：一项综述

本研究论文探讨了在计算机视觉任务中，超分辨率学习取得了显著的成功，但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品，这些系统为注释者提供关于输入图像的文本建议、标题或描述，从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注，包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外，作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法，包括图像字幕生成、视觉问答和多模态推理。尽管前景看好，但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议，强调了更多公开可用的数据集和学术界与工业界合作的必要性。

Jun, 2024

EEVEE: 一款简易的自然语言处理标注工具

EEVEE 是一种专注于简便性、效率和易用性的标注工具，可以直接在浏览器中运行，并使用制表符分隔的文件进行标注，支持多任务标注和四种任务类型。

Feb, 2024

高级交互式人机学习界面用于收集和学习复杂的注释

本文旨在通过为二分类任务提供人机学习界面，使人类注释者能够利用反事实例来补充标准的二分类标签，以缓解人类注释者适应传统标签所施加的限制。

Mar, 2024

超越标签：通过新型主动学习结构为人类提供自然语言解释的支持

该研究提出了一种新的主动学习框架，通过加入自然语言解释生成模型，实现在低资源条件下减少标签和解释注释的人工成本，并提升了决策方案生成的效果。

May, 2023

有界支持的高效在线标量注释

本文提出了一种高效的人工评分数据集构建以及系统质量评估方法，通过直接评估、网络成对排名汇总、混合法等三种评分方式来促进有效标注标量标签，并将其应用于数据集构建和系统评估，以提高与真值的相关性和评估的效率。

Jun, 2018

ALANNO：一种适用于普通人的主动学习注释系统

本研究开发了 ALANNO，一种针对 NLP 任务的开源注释系统，该系统支持多标注者的注释管理，并支持各种易于配置和扩展的 AL 方法和底层模型，以解决活性学习中存在的挑战。

Nov, 2022

LEAN-LIFE: 一个标签效率的注解框架，用于从解释中学习

本文介绍了 LEAN-LIFE，一种基于 web 的标注框架，它具有易于使用的 UI，可以为序列标记和分类任务提供所需的标签和决策解释，并在三个流行的 NLP 任务上显示，使用这种增强型监督方法可减少标注实例数量，并且提高了超过 5-10 个百分点的基线 F1 分数。

Apr, 2020

人工智能辅助机器翻译的人工评估

机器翻译系统的质量评估被提出的错误范围标注协议辅助，使用自动质量估计填充范围注释可以提供更详细的注释并将每个范围注释的时间缩短了一半，此外还可以减少最多 24% 的注释预算。

Jun, 2024

Med-EASi：医疗文本可控简化的精细标注数据集及模型

本文提出了 Med-EASi，一种众包且带有精细标注的数据集，以用于简化短文本的监督学习。采用四种不同样式的输入输出组合对 T5-large 进行微调，实现了两种无控制版本和两种可控版本的模型，控制方式通过标注四种文本转换类型以达到最优文本简化。模型结果表明，微调效果较好，且使用位置 - 感知可生成更好的简化结果。

Feb, 2023