EASE: 一种由效率增强机制驱动的易定制的注释系统
EASE 是一种基于对句子及其相关实体进行对比学习的句子嵌入方法,其利用实体语义作为丰富的训练信号,并提供了跨语言对齐的监督。在单语和多语境下,EASE 表现出竞争力或更好的性能,并在多项任务中明显优于基线方法。
May, 2022
本研究论文探讨了在计算机视觉任务中,超分辨率学习取得了显著的成功,但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品,这些系统为注释者提供关于输入图像的文本建议、标题或描述,从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注,包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外,作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法,包括图像字幕生成、视觉问答和多模态推理。尽管前景看好,但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议,强调了更多公开可用的数据集和学术界与工业界合作的必要性。
Jun, 2024
EEVEE 是一种专注于简便性、效率和易用性的标注工具,可以直接在浏览器中运行,并使用制表符分隔的文件进行标注,支持多任务标注和四种任务类型。
Feb, 2024
本文旨在通过为二分类任务提供人机学习界面,使人类注释者能够利用反事实例来补充标准的二分类标签,以缓解人类注释者适应传统标签所施加的限制。
Mar, 2024
该研究提出了一种新的主动学习框架,通过加入自然语言解释生成模型,实现在低资源条件下减少标签和解释注释的人工成本,并提升了决策方案生成的效果。
May, 2023
本文提出了一种高效的人工评分数据集构建以及系统质量评估方法,通过直接评估、网络成对排名汇总、混合法等三种评分方式来促进有效标注标量标签,并将其应用于数据集构建和系统评估,以提高与真值的相关性和评估的效率。
Jun, 2018
本研究开发了 ALANNO,一种针对 NLP 任务的开源注释系统,该系统支持多标注者的注释管理,并支持各种易于配置和扩展的 AL 方法和底层模型,以解决活性学习中存在的挑战。
Nov, 2022
本文介绍了 LEAN-LIFE,一种基于 web 的标注框架,它具有易于使用的 UI,可以为序列标记和分类任务提供所需的标签和决策解释,并在三个流行的 NLP 任务上显示,使用这种增强型监督方法可减少标注实例数量,并且提高了超过 5-10 个百分点的基线 F1 分数。
Apr, 2020
机器翻译系统的质量评估被提出的错误范围标注协议辅助,使用自动质量估计填充范围注释可以提供更详细的注释并将每个范围注释的时间缩短了一半,此外还可以减少最多 24% 的注释预算。
Jun, 2024
本文提出了 Med-EASi,一种众包且带有精细标注的数据集,以用于简化短文本的监督学习。采用四种不同样式的输入输出组合对 T5-large 进行微调,实现了两种无控制版本和两种可控版本的模型,控制方式通过标注四种文本转换类型以达到最优文本简化。模型结果表明,微调效果较好,且使用位置 - 感知可生成更好的简化结果。
Feb, 2023