高级交互式人机学习界面用于收集和学习复杂的注释
本研究引入了一个轻量级、用户友好、可扩展的框架 “Multilabelfy”,通过人机智能的协同作用,实现了高效的数据集验证和质量提升,同时突出了多标签占比的重要性,发现 ImageNetV2 数据集中约 47.88% 的图像包含至少两个标签,这凸显了对这类有影响力的数据集更严格评估的需求,并揭示了潜在标签数与模型准确性之间的负相关关系。
Jan, 2024
本文提出了一种交互式学习的图像标题生成模型,该模型使用数据增强方法来扩大人类反馈所提供的有效学习信息,并智能地将其集成到模型中,本文重点讨论了其反馈收集、数据增强和模型更新三个关键组件的实现方法。
Feb, 2022
该研究提出了一种新的主动学习框架,通过加入自然语言解释生成模型,实现在低资源条件下减少标签和解释注释的人工成本,并提升了决策方案生成的效果。
May, 2023
研究提出了一种将人类标注者引入模型微调系统中,以提供即时反馈的框架,实现了交互式查询模型预测结果、选择哪些数据标记并查看其对模型预测结果的影响等功能,该框架在各个领域都有应用潜力。
Jun, 2019
本文研究信息提取方法,提出利用人工验证的弱监督标记方法,结合人工与计算机快速处理,以实现在精度要求高的情境下避免纯手工提取耗时过长的难题,并在犯罪司法数据集上实证其优越性。
Feb, 2023
本研究论文探讨了在计算机视觉任务中,超分辨率学习取得了显著的成功,但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品,这些系统为注释者提供关于输入图像的文本建议、标题或描述,从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注,包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外,作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法,包括图像字幕生成、视觉问答和多模态推理。尽管前景看好,但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议,强调了更多公开可用的数据集和学术界与工业界合作的必要性。
Jun, 2024
本文提出了一种迭代方法,通过联合确定用人工分标注哪些样本和用训练有素的分类器进行标注哪些样本来最小化总体成本,从而解决通过云端注释服务生成数据集的成本过高的问题。作者在 Fashion-MNIST、CIFAR-10、CIFAR-100 和 ImageNet 等公共数据集上验证了该方法,并表明其总成本比完全使用人工标注数据集的成本低 6 倍,且始终比最便宜的竞争策略便宜。
Jun, 2020
人工智能和机器学习在信息系统中发挥了重要作用,然而机器学习模型不完美并且可能产生错误分类。因此,本研究提出了一种混合系统,利用人工专家对难以分类的实例进行审核,并创造了人工专家来学习对之前由人工专家审核过的未知类别数据实例进行分类。实验证明,这种方法在图像分类的几个基准测试中优于传统的人机合作系统。
Jul, 2023
该论文提出了一种新的学习人际互动的方法,利用单张静态图片中的自由文本,实现对人际互动在各种情况和关系中的建模。作者使用了基于大型语言模型生成的合成标题数据的知识蒸馏方法,成功训练出一种 “理解” 图像中人际互动的字幕模型,达到了精确、语义匹配、事实准确的预测模型。该方法在人际互动理解这一任务上,比目前最先进的图像字幕生成和情境识别模型表现更优。
Apr, 2023