ARAIDA：模拟推理增强的交互式数据标注

ACLMay, 2024

ARAIDA：模拟推理增强的交互式数据标注

ARAIDA: Analogical Reasoning-Augmented Interactive Data Annotation

Chen Huang, Yiping Jin, Ilija Ilievski, Wenqiang Lei, Jiancheng Lv

TL;DRAraida 是一种基于类比推理的方法，可以提高交互式数据注释的自动注释准确性，并减少人工校正的需求，通过动态协调注释模型和最近邻（KNN）模型，显著减少人工校正劳动力。

Abstract

human annotation is a time-consuming task that requires a significant amount of effort. To address this issue, interactive data annotation utilizes an →

human annotation interactive data annotation annotation model analogical reasoning k-nearest neighbors (knn) model

发现论文，激发创造

LIDA: 轻量级交互式对话标注工具

LIDA 是第一个可以从原始文本开始处理的对话注释系统，可支持任意机器学习模型并具有专用界面解决标注者间的不一致，是一款能提高交谈数据注释速度和质量的注释工具。

Nov, 2019

搜索相关性数据标注任务的通用化错误建模

本研究提出了一个预测性错误模型，用于检测三个规模广泛的机器学习应用（音乐流媒体、视频流媒体和移动应用）的搜索相关性标注任务中的潜在错误，并评估其提高数据标注过程的质量和效率的潜力。研究结果表明，自动错误检测模型可以在数据注释过程的效率和质量方面带来显着改善，并为人机协同机器学习领域提供重要见解。

Oct, 2023

超越标签：通过新型主动学习结构为人类提供自然语言解释的支持

该研究提出了一种新的主动学习框架，通过加入自然语言解释生成模型，实现在低资源条件下减少标签和解释注释的人工成本，并提升了决策方案生成的效果。

May, 2023

ActiveAED: 人在循环中改善注释错误检测

本文提出了 ActiveAED 的 AED 方法，可在预测循环中反复查询人类进行错误修正，从而更准确地检测错误，并在八个数据集中获得了提高的结果。

May, 2023

解决形态学类比问题：从检索到生成

本文提出了一个深度学习框架来解决类比检测和解决两个关键问题，并在 morphological analogical proportions 数据集上进行了测试表明优于符号方法。文章总结了之前的研究，并结合了 ANNe 和 AE 嵌入模型。最终得出该模型在绝大多数情况下都优于其他方法，并提供了使用 DL 来处理类比问题的一般指南。

Mar, 2023

高级交互式人机学习界面用于收集和学习复杂的注释

本文旨在通过为二分类任务提供人机学习界面，使人类注释者能够利用反事实例来补充标准的二分类标签，以缓解人类注释者适应传统标签所施加的限制。

Mar, 2024

ARN：故事类修辞推理的综合框架和数据集

通过将认知心理学中的类比推理理论在叙述上进行计算适应，我们提出了类比叙事（ARN）数据集和一个大规模的评估框架，研究了不同抽象程度的类比、不类比之间的匹配。研究结果表明，当较高级别的映射缺乏较低级别的映射时（远类比），大语言模型难以识别；而当所有映射同时存在时（近类比），大语言模型的性能得到改善。我们观察到，在所有的设置中，大语言模型的类比推理能力容易受到与查询叙事形成较低级别映射的近干扰的影响。

Oct, 2023

注释顺序很重要：适用于任意长度图像标注的循环图像注释器

该研究提出了一种新的递归图像注释器（RIA）模型，将图像注释任务形成为序列生成问题，以便 RIA 可以根据图像内容本地预测正确的标记长度。该模型在各种图像注释数据集上进行了评估，并显示其在任意长度图像标记任务上作为高质量基准的能力。此外，实验结果表明，在训练阶段中标记的顺序对最终注释性能有很大影响。

Apr, 2016

主动学习中的上下文感知图像标注

本论文提出了一种上下文感知图像注释框架（CAIAF），利用图像元数据作为相似性度量将图像聚类成组进行注释，并在注释界面上为每张图像提供有用的元数据信息作为上下文，实验结果表明它相对于传统框架减少了注释成本，同时保持了高分类性能。

Feb, 2020

实时视觉反馈用于引导基准创建：人 - 指标协同的工作流程

该篇论文提出了一种基于引导群众工作者的新型自然语言处理（NLP）基准创建范例 VAIDA，以减少创建样本中的人为偏差，并通过 NASA TLX 用户研究及专业评估证实，减少了创建样本的人力、时间投入的同时，增加了样本的整体性与质量，并降低了不同模型的创建样本的表现效果，观察到创建样本对多种模型有攻击性。

Feb, 2023