- 混合曲率决策树与随机森林
我们扩展了决策树和随机森林算法到混合曲率的产品空间,并在该研究中展示了通过在产品流形中进行简单、表达丰富的分类和回归来克服已有限制,并证明了与环境空间中的欧氏方法相比,在覆盖了各种曲率的组分流形和产品流形上具有卓越的准确性。
- CLoG: 图像生成模型的持续学习基准测试
在人工智能中,持续学习(Continual Learning)是一个重要的挑战,旨在模拟人类不断获得知识和技能的能力。本研究将关注点从基于分类任务的持续学习转移到生成模型的持续学习(CLoG)。研究通过对比传统的基于分类任务的持续学习,系统 - GNNAnatomy: 图神经网络的多层解释的系统生成与评估
GNNAnatomy 是一个模型和数据集通用的视觉分析系统,利用 graphlets 来解释 Graph Neural Networks 在图级分类任务中的行为,并通过两个指标验证推测的 graphlet 解释的有效性和对分类结果的影响。
- 塑造历史:三千年楔形文字片的高级机器学习技术分析和测定
基于深度学习和变分自编码器方法,针对库内容丰富的超过 94,000 张楔形文字片的数据集,通过研究其轮廓形状作为关键指标,成功实现了古代文献的自动分类和时代定位,为历史学家和铭刻学家提供了更深入的洞察和解释工具。
- 标签级表观和本体不确定性量化
基于标签分解的不确定性量化方法,提高成本敏感决策并帮助理解不确定性来源,使用方差等非分类度量定义总体、属概性和认知不确定性,针对分类任务进行实证评估。
- 一种基于专家驱动的组织切片图像数据生成流程
通过允许专家在数据集生成过程中融入领域知识,我们提出了一种用于细胞分割的合成数据集生成方法,可以有效地训练深度学习实例分割模型,克服了医学领域中稀缺且昂贵的注释数据的限制。
- 合作式新颖物体发现与基于盒子引导的跨模态对齐在开放词汇 3D 物体检测中的应用
CoDAv2 是一个统一的框架,用于创新性地解决有限基本类别条件下的新型 3D 物体的定位和分类问题,其中使用 3D 几何和 2D 开放词汇语义先验来发现训练期间新型物体的伪标签以及通过 3D 点云和 2D / 文本模态之间的特征对齐来提升 - CausalQuest:为 AI 代理收集自然因果问题
开发能够解决人类对因果性问题的 AI 代理的关键是建立一个全面的自然因果问题数据集。为了填补现有数据集的缺口,作者提出了 CausalQuest 数据集,该数据集包含了来自社交网络、搜索引擎和 AI 助手的 13500 个自然发生的问题。通 - 混合自动学习系统与应用
本文研究了一种基于深度神经网络和神经符号方法的分类和回归模型,并引入了 Logic Tensor Networks 作为神经符号预测模型,能够区分和解释异常连接和正常连接。通过详细对比和解释深度神经网络和神经符号网络的实现和结果,论文提出了 - 通过学习密度比进行拒绝
通过改变监督学习流程和优化损失函数的风险,提出了一种以拒绝为基础的学习范式,通过利用密度比率来决定模型的拒绝决策,并在干净和噪声数据集上进行了实证测试。
- 基于基石语言模型的持续学习的最新进展:综述
最近,基础语言模型(LMs)在自然语言处理(NLP)和计算机视觉(CV)领域取得了重要的成就。然而,由于灾难性遗忘的原因,它们仍然无法模拟类似人类的连续学习。为了解决这个问题,已经开发了各种基于连续学习(CL)的方法来改进 LMs,并使其能 - TreeFormers -- 森林砍伐司机分类下的视觉 Transformer 探索
通过使用印尼森林的卫星图像,本研究探索了使用视觉变换器(ViTs)对森林砍伐驱动因素进行分类的关键问题。通过对预训练的 ViT 进行微调并采用数据增强和纵向数据嵌入等方法,本研究在基准模型上取得显著改善,测试准确率达到了 72.9%。通过全 - 一种无分类器的可扩展医学图像分割的增量学习框架
通过引入新的分割范式,我们提出了一种基于对比学习的分类器自由网络,能够实现可变数量类别的分割,并结合知识蒸馏的增量学习框架,解决了医学图像分割中类别和领域的增量学习问题。实验证明了该方法在处理不同类别数量和增量学习中的优越性。
- Medformer:一种用于医学时间序列分类的多粒度补丁变换器
介绍了一种专为医学时间序列分类定制的多粒度补丁变换器 Medformer,该方法利用交叉通道补丁、多粒度嵌入、两阶段多粒度自注意等新机制,在多个公共数据集上的实验证明了其在医疗应用中的显著影响。
- 特征融合提升分类效果:结合 Dempster-Shafer 理论和多个 CNN 架构
使用 Dempster-Shafer 理论构建的集成模型解决深度学习中的不确定性问题,通过特征提取、信任度计算、融合和效用计算等步骤,该方法在 CIFAR-10 和 CIFAR-100 数据集上进行的实验展示了显著的分类准确性提升,相较于最 - 适应性选组等覆盖的共形分类
引入了一种符合性推断方法以评估分类中的不确定性,通过生成具有有效覆盖率的预测集,并在自适应选择的特征上进行。这些特征经过精选以反映潜在的模型限制或偏差,有助于在提供有信息的预测的同时,在最敏感的群体中确保平等的覆盖率,从而找到实践上的一个妥 - 通过数据本地化对稀疏对抗扰动进行认证鲁棒性
通过对局部化数据分布的理解,提出了一种基于几何形态的简单分类器 Box-NN,并在 MNIST 和 Fashion-MNIST 数据集上取得了对于稀疏攻击的认证稳健性方面的最新研究成果。
- 用于高血压程度的光电容积脉搏图信号深度学习分类
使用时间频谱技术 (如 STFT) 相结合的神经网络 (如 CNN、LSTM、Bi-LSTM) 以及机器学习分类器 (SVM 和 RF),本研究在超过 200 名血压高的患者 (650 + 信号样本) 的 PPG 信号上进行分类,通过两个分 - 医学影像学中的持续学习:从理论到实践的调查和实际分析
通过综述医学领域中的连续学习研究,本文旨在全面审视近期的文献,突出最新趋势,并指出实际问题,包括分类、分割、检测等任务中的连续学习研究。除了识别挑战并提供应对策略,我们还对医学影像中连续学习的现状进行批判性讨论,包括识别开放问题并勾勒有前景 - 加强审前法律分析:针对辩护陈述分类和解释的透明可访问数据集
该研究旨在应对自然语言处理和法律信息学领域内警务讯问中个人陈述的分类问题,通过引入一个新颖的训练集和一个经过调优的 DistilBERT 模型,该模型在区分真实和虚假陈述方面表现出卓越的性能,并运用可解释的人工智能方法提高解释性,最后提供一