- 平滑伪标签
在半监督学习中,引入了一种平滑伪标签损失函数来解决标签稀缺性带来性能不稳定的问题,并通过实验验证了其在稀缺标签情况下的显著改善。此外,还提出了一个新的基准测试,在整个数据集中随机选择标记的图像,以改进半监督学习算法的可靠性和解释性。
- 使用成员预言主动学习组合优化
使用成员预测器解决未知线性约束的组合优化问题,以学习和利用替代线性约束的新框架,并通过采样策略和解决 0-1 整数线性规划来选择需要标记的新点,以提高结果的质量。
- ICLR基于 Lewis 权重采样的多个深度模型的一次性主动学习
我们提出了一种一次性主动学习方法,通过使用不同的网络骨干提取同一数据集的不同表示形式,并通过 l_p 回归表达式主动学习每个表示形式上的线性预测层,在 11 个基准测试上取得了与多目标模型的最先进主动学习方法相媲美的性能。
- 通过对比学习和不确定性估计增强 Sentinel 2 影像的主动学习
介绍了一种新颖方法,通过将半监督学习与主动学习策略相结合,提高了卫星图像分析的标签效率;采用对比学习和蒙特卡洛失活来估计不确定性,在 Sentinel-2 卫星图像上使用 Eurosat 数据集进行了分析,结果显示在不平衡类别情况下,该方法 - 一个带有类平衡策略的时间序列分类的主动学习框架
本研究探讨主动学习策略在降低时序分类任务中所需标记数据数量方面的应用,通过提出一种新的类平衡实例选择算法,有效地解决了不平衡时序数据集中的分类性能和实例选择偏差问题,并在触觉纹理识别和工业故障检测领域证明了该方法的有效性。
- 一个统一的方法用于主动学习和外域检测
SISOM is a unified solution that combines the strengths of active learning and out-of-distribution detection, achieving - ActiveLLM:基于大型语言模型的用于文本少样本场景的主动学习
ActiveLLM 是一种新颖的主动学习方法,通过利用诸如 GPT-4、Llama 3 和 Mistral Large 之类的大型语言模型来选择实例,显著提高了 BERT 分类器在少样本场景中的分类性能,并且可以扩展到非少样本场景,为各种学 - 基于完全贝叶斯神经网络的不连续和非稳态数据的主动学习
主题:主动学习、概率替代模型、高斯过程、不连续性、完全贝叶斯神经网络;摘要:评估了完全贝叶斯神经网络在小数据条件下使用无 U-Turn 采样器进行主动学习任务的适用性和性能,突显了其增加物理科学问题相关测试函数的预测准确性和可靠性的潜力。
- 自主驾驶中的高效主动学习:基于车辆动力学的场景表示来进行轨迹预测的无视觉感知
探索在自动驾驶机器学习任务中利用轨迹和动态状态信息进行高效数据筛选的研究,提出了在主动学习框架中的轨迹状态聚类和采样方法,旨在降低注释和数据成本同时保持模型性能。研究通过利用轨迹信息引导数据选择,在训练数据中促进多样性,证明了方法在轨迹预测 - 简单问题的主动学习
我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系,并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别,我们展示了更强的结果,包括计算效率和对未知数据集的适应性。
- 隐私感知主动学习中的最大信息增益策略研究
通过使用信息增益最大化启发式方法,我们开发了一种增强的主动学习方法,并在一个真实环境中对其有效性进行了评估,该环境中由于隐私问题,只能由人类分析员对电子邮件的编辑版本进行标记。在两个案例研究中,我们发现对模型性能进行最佳评估的方法是由一位高 - 主动偏好学习用于样本内外排序项目
学习基于有噪声的配对比较的项目顺序,在无法分配具体标签的情况下很有用,尤其是在标注者必须进行主观评估的情况下。本研究在具有上下文属性的有序项目中研究了配对偏好反馈的主动学习,提出了两种算法来贪婪地最小化排序错误,证明了这些算法相对于非上下文 - ActiveNeuS: 使用神经隐式表面不确定性的主动三维重建
提出了一种名为 ActiveNeuS 的方法,该方法在选择视图时考虑了不确定性,通过同时计算图像渲染不确定性和神经隐式曲面不确定性,避免了稀疏输入训练阶段引入的偏差,通过使用曲面信息和格点高效地选择多样的视点,提升了 3D 场景重建的性能。
- 从两两比较查询中学习线性效用函数
线性效用函数从成对比较查询中的可学习性研究。具体来说,我们考虑两个学习目标:首先是预测成对比较的样本外响应,其次是近似恢复效用函数的真实参数。我们证明在线性效用在被动学习设置下是高效可学习的,无论查询响应是否受到噪声干扰,并且在分布足够 “ - 结合 X-Vectors 和贝叶斯批量主动学习:用于语音识别的两阶段主动学习流程
该研究通过强调数据为中心的人工智能方法,引入一种新的两阶段主动学习(AL)流程,用于自动语音识别(ASR),结合了无监督和监督的 AL 方法。该方法通过使用 x-vectors 聚类从未标记的语音数据中选择样本进行多样化的样本选择,从而建立 - 图上主动学习中的不确定性
基于节点分类的不确定性采样是主动学习策略,通过迭代地获取具有最高不确定性的数据点的标签,以提高机器学习模型的数据效率。本文首次对节点分类的不确定性采样进行了全面研究,我们超越了预测不确定性来评估不确定性采样,揭示了与其他主动学习策略之间的显 - 深度主动学习综述:近期进展与新前沿
深度学习主导的主动学习方法的调查;介绍了 DAL 任务,总结了最重要的基准和常用的数据集;系统地提供了 DAL 方法的分类,包括注释类型、查询策略、深度模型架构、学习范式和训练过程,并客观分析它们的优点和缺点;全面总结了 DAL 在自然语言 - 使用任务自适应预训练的主动学习方法用于语音情感识别
通过利用主动学习 (AL) 和任务适应预训练 (TAPT) 方法,我们提出了一种名为 extsc {After} 的情感语音识别 (SER) 框架,用于增强性能和效率,实验证明我们的方法在仅使用 20%的样本时,准确率提高了 8.45%,时 - 基于预测准确度的医学图像分割主动学习
通过引入预测准确率来定义不确定性,我们提出了一种高效的基于预测准确率的主动学习方法(PAAL)用于医学图像分割,在保证采集样本的不确定性和多样性的同时,显著降低了大约 50% 到 80% 的标注成本,具有在临床应用中的重要潜力。
- 面向主观 NLP 任务的标注者中心主动学习
利用主观自然语言处理任务进行准确的人类判断的关键是在注释过程中纳入广泛的视角。引入了注释者中心主动学习策略 (ACAL),结合数据采样和注释者选择策略,旨在高效地近似获取人类判断的全面多样性,并使用注释者中心度量评估模型性能。对于七个主观自