高级交互式人机学习界面用于收集和学习复杂的注释

IJCAIMar, 2024

高级交互式人机学习界面用于收集和学习复杂的注释

An Interactive Human-Machine Learning Interface for Collecting and Learning from Complex Annotations

Jonathan Erskine, Matt Clifford, Alexander Hepburn, Raúl Santos-Rodríguez

TL;DR本文旨在通过为二分类任务提供人机学习界面，使人类注释者能够利用反事实例来补充标准的二分类标签，以缓解人类注释者适应传统标签所施加的限制。

Abstract

human-computer interaction has been shown to lead to improvements in machine learning systems by boosting model performance, accelerating learning and building →

human-computer interaction machine learning systems model performance user confidence binary classification

发现论文，激发创造

利用人机交互提升计算机视觉数据集质量

本研究引入了一个轻量级、用户友好、可扩展的框架 “Multilabelfy”，通过人机智能的协同作用，实现了高效的数据集验证和质量提升，同时突出了多标签占比的重要性，发现 ImageNetV2 数据集中约 47.88% 的图像包含至少两个标签，这凸显了对这类有影响力的数据集更严格评估的需求，并揭示了潜在标签数与模型准确性之间的负相关关系。

Jan, 2024

交互式机器学习：图像字幕生成

本文提出了一种交互式学习的图像标题生成模型，该模型使用数据增强方法来扩大人类反馈所提供的有效学习信息，并智能地将其集成到模型中，本文重点讨论了其反馈收集、数据增强和模型更新三个关键组件的实现方法。

Feb, 2022

利用大型语言模型（LLMs）支持人工智能在线风险数据协作注释

利用 LLMs 作为交互式研究工具，促进人类编码员与人工智能之间的合作，有效地标记大规模在线风险数据。

Apr, 2024

超越标签：通过新型主动学习结构为人类提供自然语言解释的支持

该研究提出了一种新的主动学习框架，通过加入自然语言解释生成模型，实现在低资源条件下减少标签和解释注释的人工成本，并提升了决策方案生成的效果。

May, 2023

人机协作快速土地覆盖制图

研究提出了一种将人类标注者引入模型微调系统中，以提供即时反馈的框架，实现了交互式查询模型预测结果、选择哪些数据标记并查看其对模型预测结果的影响等功能，该框架在各个领域都有应用潜力。

Jun, 2019

针对文本文档的高精度信息提取的人机协作优化

本文研究信息提取方法，提出利用人工验证的弱监督标记方法，结合人工与计算机快速处理，以实现在精度要求高的情境下避免纯手工提取耗时过长的难题，并在犯罪司法数据集上实证其优越性。

Feb, 2023

具有深度学习和自然语言能力的辅助图像标注系统：一项综述

本研究论文探讨了在计算机视觉任务中，超分辨率学习取得了显著的成功，但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品，这些系统为注释者提供关于输入图像的文本建议、标题或描述，从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注，包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外，作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法，包括图像字幕生成、视觉问答和多模态推理。尽管前景看好，但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议，强调了更多公开可用的数据集和学术界与工业界合作的必要性。

Jun, 2024

MCAL：最小成本人机主动标注

本文提出了一种迭代方法，通过联合确定用人工分标注哪些样本和用训练有素的分类器进行标注哪些样本来最小化总体成本，从而解决通过云端注释服务生成数据集的成本过高的问题。作者在 Fashion-MNIST、CIFAR-10、CIFAR-100 和 ImageNet 等公共数据集上验证了该方法，并表明其总成本比完全使用人工标注数据集的成本低 6 倍，且始终比最便宜的竞争策略便宜。

Jun, 2020

提高人机协作系统的效率：将人工智能加入人类专家

人工智能和机器学习在信息系统中发挥了重要作用，然而机器学习模型不完美并且可能产生错误分类。因此，本研究提出了一种混合系统，利用人工专家对难以分类的实例进行审核，并创造了人工专家来学习对之前由人工专家审核过的未知类别数据实例进行分类。实验证明，这种方法在图像分类的几个基准测试中优于传统的人机合作系统。

Jul, 2023

从弱文本监督中学习图像中的人际互动

该论文提出了一种新的学习人际互动的方法，利用单张静态图片中的自由文本，实现对人际互动在各种情况和关系中的建模。作者使用了基于大型语言模型生成的合成标题数据的知识蒸馏方法，成功训练出一种 “理解” 图像中人际互动的字幕模型，达到了精确、语义匹配、事实准确的预测模型。该方法在人际互动理解这一任务上，比目前最先进的图像字幕生成和情境识别模型表现更优。

Apr, 2023