- 面向主观 NLP 任务的标注者中心主动学习
利用主观自然语言处理任务进行准确的人类判断的关键是在注释过程中纳入广泛的视角。引入了注释者中心主动学习策略 (ACAL),结合数据采样和注释者选择策略,旨在高效地近似获取人类判断的全面多样性,并使用注释者中心度量评估模型性能。对于七个主观自 - 基于语言驱动的多样化开放集 3D 物体检测的主动学习
提出了 VisLED 算法,一种基于语言驱动的主动学习框架,用于多样的开放式 3D 物体检测,通过查询多样且有信息量的样本数据,提高模型对少数类别或新颖物体的检测能力。在 nuScenes 数据集上的实验证明,相比于随机抽样和熵查询方法,V - ICLR神经主动学习超越赌局
我们提出基于新设计的用于流式和池式主动学习的利用和探索神经网络的算法,针对这一挑战,在非参数设置方面提供了两个算法的理论性能保证,表明所提出的方法对于 K 的错误增长速率较慢,并通过广泛的实验评估了所提出的算法,始终优于最先进的基线模型。
- 面向物理的主动学习在加速量子化学模拟中的应用
通过使用主动学习 (AL),可以以经济的时间和资源投入及最少的人工干预构建具有鲁棒数据效率的潜力。实现了构建可靠的数据高效势能,并在牵引谱模拟、生化分子构象搜索和 Diels-Alder 反应的时间分辨机理研究中展示了该协议的多功能性。
- 成本高效学习的交互本体匹配
本研究通过引入适用于本体匹配的主动学习方法 DualLoop 解决最后一英里问题,其中包括可调节的启发式匹配器、适应高度不平衡数据的短期学习器和创建调整新启发式方法以探索潜在匹配的长期学习器。通过在三个不同规模和领域的数据集上评估 Dual - ACLAnchorAL:用于大规模和不平衡数据集的高效主动学习
AnchorAL 是一种针对不平衡分类任务的主动学习方法,通过选择类特定的样本作为锚点,并从未标记数据池中获取最相似的样本来构建子池,从而解决了大型数据池上传统基于池的主动学习的计算复杂度高、准确率低的问题,并促进了对少数类实例的发现与类平 - 主动测试时间适应:理论分析与算法
使用主动学习在完全的测试时间适应设置中,通过限制标记测试实例的数量,提高测试领域之间的整体性能,同时避免灾难性遗忘,从而在测试时间适应(TTA)下解决领域偏移的问题。
- 针对组织病理图像分类的专注主动学习
Focused Active Learning combines Bayesian Neural Network with Out-of-Distribution detection to estimate different uncert - 使用有针对性的干预进行活跃因果学习,解码化学复杂性
基于分子结构预测和增强固有性质对于医学、材料科学和环境管理中的设计任务至关重要,本研究介绍了一种主动学习方法,通过智能抽样和干预来辨识潜在的因果关系,以优化在未接触到的化学空间内的设计任务。
- 精确农业中高效注释的主动学习:基于作物 - 杂草语义分割的用例
优化深度学习模型,尤其是在农业领域,通过进行比较性研究,发现主动学习方法在语义分割任务中比随机采样有更好的性能,但在具有高类别不平衡和冗余图像的农业数据集上仍需要进一步的研究。
- 循环中的 LLM:利用大型语言模型注释在低资源语言中进行主动学习
通过在主动学习环路中利用 LLM 的潜力进行数据标注,我们的提议在极低的数据需求下显著提高了性能,为低资源环境中的自动化带来了巨大的潜在成本节约。这种方法能够弥合低资源语言和人工智能之间的鸿沟,促进更广泛的包容,并有潜力在不同的语言环境中实 - ACL文本摘要的幻觉多样性感知主动学习
通过在文本摘要中测量语义框架、话述和内容可验证性中的细粒度错误,我们提出了第一个主动学习框架来减轻 LLM 幻觉,减少对幻觉错误的昂贵人工注释。经过对三个数据集和不同主干模型的广泛实验,我们的方法在有效和高效地减轻 LLM 幻觉方面具有优势 - 机器人操作中贝叶斯模型的主动探索
通过积极学习方法和贝叶斯神经网络模型,提高机器人操纵的模型质量和数据效率,以应对复杂环境下的多任务处理挑战。
- 自适应组合最大化:超过近似贪心策略
我们研究了自适应组合最大化问题,在机器学习中是一个核心挑战,并应用于主动学习以及其他许多领域。我们研究贝叶斯设置下,考虑最大化目标在基数约束和最小成本覆盖下。我们提供了新的综合近似保证,包括之前的结果,并且更加加强了它们。我们的近似保证同时 - 主动学习器的脆弱性
在针对文本分类的活跃学习技术中,选择正确的文本表示、分类器以及评估指标是至关重要的,因为不同的因素可能会导致活跃学习技术的有效性受到限制。
- CODA: 适用于 HAR 的高效测试时领域适应机制
基于主动学习理论,CODA 是一种用于移动感知的成本高效域适应机制,它从数据分布的角度解决了实时漂移问题,通过聚类损失和重要性加权主动学习算法保留不同聚类之间的关系,展示了与神经网络解决方案的整合,并通过对各种数据集进行细致评估证明了 CO - 图像合成个性化的生成式主动学习
该研究提出了一项旨在将传统上应用于判别模型背景下的主动学习方法应用于生成模型的试点研究,重点关注图像合成个性化任务。通过引入锚定方向的概念,将查询过程转化为半开放问题,并提出了一种基于方向的不确定性采样策略来实现生成式主动学习并解决开发 - - DP-Dueling:从偏好反馈学习而不损害用户隐私
在差分隐私的约束下,我们提出了一种首个能够保护用户偏好的活跃学习的差分隐私决策竞争算法,具有接近最优性能的高效计算能力与遗憾边界。
- 图像注释的模块化深度主动学习框架:眼科人工智能项目的技术报告
图像标注是医学成像和疾病诊断领域中确保患者适当治疗和追踪疗程进展的最重要任务之一。通过使用深度学习的分割算法和主动学习方法,MedDeepCyleAL 提供了一个完整的端到端框架,可自动化图像标注并在眼科数据方面表现出优越性能。
- 通过主动学习实现高效的息肉分割
提出了一种深度主动学习框架,用于高效标记息肉分割,在有限的标注预算下实现了最佳性能。