- 防患于未然:胸部异常检测案例研究
本文探讨了预防疾病和预防医学中使用的 AI 模型出现问题的重要性,以及分析了一个 Kaggle 竞赛用例 - X 射线肺图像异常检测中的数据不平衡性问题,并说明了如何通过在整个生命周期中监测数据和模型平衡性来消除偏见。
- 应对稀有类别挑战的不协调检测的转移学习和主动学习
提出了针对稀缺类别问题的迁移和主动学习解决方案,并评估了其采集策略,包括一个提出的罕见类概率(PRC)方法;在社交媒体上收集认知失调的语言样本。PRC 是一种简单而有效的策略,可以指导注释并最终提高模型准确性,而按特定顺序进行迁移学习可以提 - 通过自适应数据修剪和平滑 - 引导正则化对水下声纳目标识别的改进
本研究针对数据采集困难的问题,对基于水声识别的船舶辐射信号进行数据整合,采用交叉熵策略和 KL 散度的光滑度约束正则化方法来补充并优化训练数据,实验证明,该方法在低资源场景下能显著提升模型表现。
- 自动驾驶危急情况解释中的因果关系理解
为确保自动驾驶系统的安全运行,该研究引入了因果查询的正式化,建立了抽象的安全原则,从而降低与关键影响因素相关的临界性,并对数据采集、模型质量等方面做出了贡献。
- PyRelationAL: 一个用于主动学习研究和开发的 Python 库
介绍了一个名为 PyRelationAL 的机器学习活动学习的开源库,它可以帮助通过经济的数据获取方法迭代式地训练机器学习模型。该库实现了各种已发布的方法,并根据现有文献提供了广泛的基准数据集和 AL 任务配置。
- 没有预测模型的数据不确定性
通过距离权重类纯度不使用预测模型的不确定性估计方法,我们验证了该方法能够有效地构建高性能预测模型,无论是机器学习的数据获取,还是主动学习任务中的不确定性估计。
- AAAITrustAL: 使用知识蒸馏的可信主动学习
该研究通过提出一种新的知识蒸馏目标,并利用一种被称为 “一致性” 的概念来选择前身模型作为教师,以减轻遗忘的知识。新的教师模型能够避免标签的遗忘,提高标记数据的不确定性 / 多样性,并弥补由人类注释器产生的有缺陷的标签。
- 机器学习在野生动物保护中的视角:视野中的生物多样性
利用机器学习技术,结合生态领域知识,可以提升动物生态学家们对现代传感器技术产生的大量数据的理解和对物种保护的监测能力,最终将生态模型作为机器学习模型的约束条件,从而可靠地估计种群数量、研究动物行为和减缓人类 / 野生动物冲突。
- 高度自动化驾驶感知角落案例的应用驱动概念化
该研究旨在提供一个基于应用需求的自动驾驶车辆中的异常情况检测系统,主要针对机器学习、传感器模态、数据采集等应用和研究领域进行研究和探讨。
- 深度主动学习综述
这篇文章探讨了深度主动学习的现状和未来发展方向,介绍了目前现有的挖掘数据特征的多种方法,并且对 “深度主动学习” 进行了定义和系统梳理。
- 通过光束分裂相机支架实现真实超分辨率数据集
本文提出了一种新的数据采集技术,通过 beam-splitter 捕获相同场景的低分辨率和高分辨率图像进行训练预处理,提出包含 11,421 对低分辨率高分辨率图像的数据集,展示了该数据集如何显著提高超分辨率技术在现实世界图像上的质量。
- Slice Tuner:一种用于准确和公平机器学习模型的选择性数据采集框架
本文提出了利用切片优化数据采集的方法 Slice Tuner,通过维护学习曲线并使用凸优化来选择不同切片的数据量,以便在保证准确性和公平性的同时优化模型。在使用众包数据采集的真实数据集上评估了 Slice Tuner,并证明了其显著优于传统 - 面向通信高效边缘机器学习的数据重要性感知用户调度
本研究旨在提高边缘学习的数据采集效率,设计一种基于数据重要性的用户调度算法,该算法通过考虑数据的信息性指标,利用多用户多样性实现更快的模型收敛速度。
- PILOT: 物理信息学习优化轨迹用于加速 MRI
探讨了 MRI 扫描加速和重建的优化方案,提出使用深度学习和 k 空间轨迹的联合方案,用于同时优化数据获取的时间效率和图像重建的质量,并证明其对于图像重建和分割任务,具有显著的加速因素和质量改进。
- CVPR相机镜头超分辨率
研究了基于摄像头镜头的 CameraSR 方法,旨在改善实际成像系统中分辨率(R)和视野范围(V)之间的固有平衡问题,并提出了两种新的数据采集策略, City100 数据集表明, CameraSR 具有提高单图超分辨率性能的实际解决方案,并 - 强化学习自然环境基准
本文提出了三类全新的强化学习基准测试领域,包含了一定数量的自然世界的复杂性,同时支持快速而广泛的数据采集,此举将挑战强化学习社区开发更加稳健的算法以满足高水准的评估要求。
- 全球卫星图像建筑物检测
利用遥感技术的建筑物检测创建人口密度地图,包括数据采集、半监督方法等解决策略。
- CVPR虚拟世界作为多对象跟踪分析的代理
本研究运用计算机图形学的进展生成虚拟世界,实现了完全标记、动态、逼真的代理虚拟世界,并通过虚拟 KITTI 数据集提出了有效的现实世界克隆方法,通过该方法,可以提高深度学习算法预训练的性能。本研究进一步证明了虚拟世界可以测量各种天气和成像条 - 智能手机数据采集与分布式计算中的激励机制
本文研究了为鼓励智能手机用户在数据采集和分布式计算应用上合作而设计的不同激励机制,并提出一种基于奖励的协作机制,以及如何针对不同的用户类型设计最优契约。