- 高性能视频实例分割无需视频注释
通过利用图像数据集,本研究介绍了一种消除视频注释的方法,并通过适应性的 PM-VIS 算法来处理边框和实例级像素注释。通过引入 ImageNet-bbox 来补充视频数据集中缺失的类别,并通过 PM-VIS + 算法根据注释类型调整监督。通 - CVPR基础模型的参数高效主动学习
通过在活动学习(AL)框架内应用参数高效微调方法对极限预算限制的分类任务中的采样选择过程进行研究,本研究展示了基础视觉转换模型在图像数据集上表现出色的少样本性能,并突出显示了将参数高效微调方法与基础模型相结合的战略优势,从而改进了这些具有挑 - MindSet: Vision. 用于关键心理实验中测试深度神经网络的工具箱
一项关于深度神经网络与人类视觉的研究,介绍了名为 MindSet: Vision 的工具箱,包含一系列图像数据集和相关脚本,用于测试 DNNs 在 30 个心理发现方面,并提供了代码以重新生成这些数据集,并提供了测试 DNNs 的代码,使用 - VDNA-PR:基于通用数据集表示的鲁棒序列视觉地点识别
该研究利用视觉神经元激活值跟踪图像序列,提出了一种能够处理图像数据集的通用粒度特征表示方法,该方法可以用于实现视觉地点识别(VPR)并能够在处理室内环境和航空影像等领域巨大的领域变化时保持良好的鲁棒性。
- 神经网络的热带决策边界对抗性攻击具有鲁棒性
我们引入了一种简单易实现且计算效率高的热带卷积神经网络架构,该架构能够对抗敌对攻击。我们利用分段线性神经网络的热带性质,将数据嵌入热带投影圆环中的单隐藏层,并可添加到任何模型中。我们从理论上研究了其决策边界的几何特性,并通过计算实验展示了其 - 森林火灾检测中支持向量机(SVM)在具有挑战性数据集上的性能分析
这篇文章主要研究了使用支持向量机(SVM)对基于图像数据集的森林火灾检测进行性能和利用率分析。通过对带标签数据进行训练,SVM 能够识别与火灾相关的特征,如火焰、烟雾或森林区域的视觉特征变化。文章深入探讨了 SVM 的使用,包括数据预处理、 - 光谱极化视觉:光谱极化实际数据集
提出了两个新的光谱极化数据集:三色 Stokes 图像和高光谱 Stokes 图像。这些数据集包含线性和圆偏振;引入了多个光谱通道;并且具有广泛选择的真实世界场景。通过这些数据集,分析了光谱极化图像的统计特性,发展了高维数据的有效表示方式, - 评估 XAI 事后技术的准确性:与地面真实解释数据集的比较研究
评估可解释人工智能方法与其基础模型的逼真度是一项具有挑战性的任务,本研究通过引入三个可靠的解释基准数据集,对当前最先进的可解释人工智能方法进行公平客观的比较,以识别逼真度较低的方法,并将其排除在进一步研究之外,促进了更可靠和有效的可解释人工 - 行星科学数据的特征提取和分类:机器学习的应用
采用机器学习神经网络来识别外行星任务的图像数据集,以实现特征识别。我们分别应用了转移学习和更新的训练模型的方法来识别埃罗帕上混沌区断裂冰的冰块,以及通过训练模型来识别土卫六上的云,进一步验证了我们的技术。
- ICCV探讨挑战场景的自动曝光
为了解决 Autoexposure (AE) 算法在光线变化等复杂环境中的问题,研究人员捕获了一个包含移动物体、明亮光源和变化光照等要素的新的 4D 曝光数据集,并设计了一个软件平台,使 AE 算法能够与该数据集配合使用。通过使用这个数据集 - 细粒度的运动、瑜伽和舞蹈姿势识别:一项基准分析
人体姿势估计是计算机视觉中的一个复杂问题,本研究通过引入深度学习技术和提出的 SYD-Net 模型,在解决体育运动和舞蹈姿势分类问题上取得了显著的进展。
- RANSAC-NN: 使用 RANSAC 的无监督图像异常检测
基于 RANSAC-NN 算法的无监督图像异常检测在各类数据集中表现优秀,无需超参数调整,并且对图像错误标记的检测有潜在应用。
- 预测美观,好感与美学质量:一项对视觉美学研究中图像数据库的比较分析
通过对 12 个不同美学评分数据集的比较,本文发现不同数据集中的美学评分可预测性存在显著差异,并发现照片和绘画的美学评价具有一致性,但这些差异也在一定程度上对单一数据集的研究结果具有普适性的假设提出了质疑。
- 高维数据聚类评估的自监督方法
提出了一个基于深度学习的框架,在复杂的图像数据集中生成代表性嵌入,然后将这些低维嵌入馈送到 VAT/iVAT 算法中,以估计潜在的聚类结构。
- 使用深度条件生成模型从属性中学习结构化输出表示
本文使用深度条件生成模型的方法,提出一种针对属性控制的结构化输出表示形式,并使用 CelebA 数据集和 CUB-200-2011 数据集进行训练和生成。研究结果表明,使用 CVAE 框架可以学习到一种脱离关联的多模态先验分布,从而更好地生 - 张量空间中的基张量主成分分析
针对张量 PCA 问题,本文提出了一种数学框架,通过从实自伴张量算子中导出张量空间的基础来减少问题的导出;研究了三种不同的情况来导出:从自伴张量算子中的基础,一个秩 - 1 的基础,以及一个子空间中的基础,并采用子空间方法导出张量 PCA。 - CVPR跨 GAN 审计:预训练生成模型属性层面的无监督相似性和差异性识别
该论文提出一种名为 Cross-GAN Auditing (xGA) 的新型 GAN 审核工具,基于属性进行 GAN 模型比较和审核,并使用新的指标对该工具进行评估。实验结果表明,xGA 优于基准方法,能够对在各种图像数据集上训练的 GAN - 强韧自编码器用于集体污染去除
本论文提出一个紧凑的自编码器公式,实现了在没有干净图像训练的情况下,去除图像数据中的稀疏损坏和异常,并展示了学习的流形结构在未见数据样本上的有效泛化能力。
- TT-TFHE: 一个支持环上完全同态加密的神经网络结构
TT-TFHE 是一个基于神经网络的同态加密框架,可以有效将 TFHE 用于表格和图像数据集中,该框架在加密数据推断的时间和准确性方面表现出色,特别是相对于其他 TFHE 设置和 HE 变体。
- MM非自由群作用的等变表示
本研究介绍了一种方法,用于学习相对于数据的一般群作用等变的表示。该方法适用于非自由的行动,即通过非平凡的对称性稳定数据的行动。该方法基于群论中的轨道稳定子定理,保证理想学习者推断同构表示。最后,我们对具有旋转对称性的图像数据集进行了实证研究