- 杂草分级的野外无人机影像数据集:蒴草数据集
研究通过使用商业无人机和计算机视觉系统,对西蒙塔纳州的草地进行航拍,训练了图像分类器以识别叶苣草的存在,并获得了 0.84 的准确率,为生态学,保护和遥感领域提供了改进叶苣草分类性能的机会。
- ICLRTransformer 能否捕获物体之间的空间关系?
当前计算机视觉系统在识别实物基础空间关系方面的性能较差,通过提出了精确的关系定义以允许对基准数据集进行一致的标注,并利用 Transformer 模型的长程注意力能力对这一任务提出新的方法进行评估。我们提出了一种名为 “RelatiViT” - 通过混合退化模型和鉴别器实现实际场景立体图像超分辨率
本论文提出了一种新颖的方法,通过整合隐式立体信息辨别器和混合降质模型来弥补现实世界立体域中复杂降质与现实世界单幅图像超分辨率领域中简单降质之间的差异,确保有效增强并保持视差一致性。
- 朝着无光晕的图像:一项调查
镜头光晕是一种常见的图像伪影,可以显著降低图像质量并影响计算机视觉系统的性能。本调查综述了镜头光晕的多方面领域,包括其基本物理、影响因素、类型和特征。研究了光晕形成的复杂光学机制,涉及镜头系统内部反射、散射、衍射和色散等因素。探讨了光晕的各 - 设计一种混合神经系统,用于从基于分形的模拟学习现实世界的裂缝分割
鑑於混凝土基礎設施結構完整性評估的重要性,鑑定裂紋至關重要。然而,對於計算機視覺系統來說,強大的裂紋分割仍然是一項具有挑戰性的任務,原因在於混凝土表面的多樣外觀、不同的照明和天氣條件以及不同缺陷的重疊。本文提出了一種基於分形的高度保真度裂紋 - 野外合成孔径雷达计算机视觉的未解之谜及对 Patricia Wu-Murad 的搜索
应用 EfficientDET 和无监督 RX 光谱分类器两个计算机视觉系统在 Wu-Murad 野外搜救努力中,对 98.9GB 的无人机图像的挑战进行详细说明,并确定了未来研究的 3 个方向。
- CVPR单细胞显微镜中基于干预式转移的分布外泛化
本文提出了一种名为 Interventional Style Transfer 的方法,是针对在计算机视觉系统的实际应用过程中,包括在生物医学研究的发现过程中,需要具有一种对上下文干扰具有不变性及对新数据具有普遍适用性的因果表示的问题,在两 - 降阶复杂多边形引发神经网络感知的基本问题
研究了现代计算机视觉系统与人类视觉存在的差距,通过测试神经网络对多变形正多边形边缘降级的图像的分类和恢复能力,发现神经网络的行为与人类行为存在冲突,引发了对现代计算机视觉模型的鲁棒性和学习能力的根本质疑。
- 实时物体检测:使用 PyTorch 重新实现 YOLOv1
使用 PyTorch 框架实现了基于 YOLO v1 架构的实时目标检测,进行了多项技术尝试并与原始算法进行了指标比较。
- 架构无关的迭代式黑盒认证对抗性贴片防御
本文介绍了针对图像分类器的对抗性贴片攻击的问题,并提出一种名为 IBCD 的两阶段迭代黑盒认证防御方法,旨在提高构架无关的认证防御在黑盒攻击情境下的可行性并检验其有效性和效率。
- 男性也会洗衣服:多属性偏见放大
本文拟解决了计算机视觉中的社会偏见问题,主要集中于模型使用多种属性注释时会放大潜在偏见、评估指标的局限性以及提供建议的新度量标准和方法。
- 视觉特征提取器系统评估的公平性指标
该研究提出了三个公平指标,以量化视觉系统的伤害和偏见,并定义了适用于各种计算机视觉模型的精确实验方案,以促进计算机视觉研究中的公平测评。
- 针对超高分辨率图像分割的降采样学习
本文提出一种基于学习性下采样模块的图像分割算法来解决低成本语义分割,优化采样密度分布并通过规则项鼓励采样位置聚焦于对象边界,实验证明对图像分辨率高、计算资源限制的三组数据集均具有高效 - 准确性的优势。
- 机器图像编码:一种端到端学习方法
本研究设计了一种基于神经网络的端到端学习的机器目标图像编解码器,通过一系列训练策略,解决了计算机视觉任务损失、图像失真损失和数据率损失之间竞争的问题,并在目标检测和实例分割任务中取得了比 VVC 标准更好的表现,是首个端到端学习的针对机器的 - ICLR对抗性贴片的认证防御
本文介绍了对抗补丁攻击的认证和经验性防御措施,其中首次提出了认证防御措施,并实验了不同补丁形状的测试,获得了出人意料的良好的鲁棒性转移。
- 快与慢:基于记忆的移动视频物体检测
本文探讨了通过在计算机视觉系统中使用记忆来改进视频流中的物体检测的精度和减少计算时间的问题。我们通过交替使用传统的特征提取器和极其轻量级的提取器展示了在存在时间记忆的情况下,进行准确检测所需的计算量是非常小的。此外,我们展示了记忆容纳了足够 - Synscapes:用于街景解析的照片级合成数据集
使用逼真的渲染技术创建的 Synscapes 合成数据集在街景分割的训练和验证方面展示了最先进的结果,并研究了网络在合成数据上推断时的行为,并分析了现有分割和检测模型,为计算机视觉系统的分析提供了细微的信息。
- NIPS深度关注追踪:通过反馈学习实现
该研究论文提出了一种基于视觉注意力的训练深度分类器的互补学习算法,利用正反馈操作生成注意力图来作为正则化项,该机制能够使分类器学习到关注具有外观变化鲁棒性的目标对象的区域,实验证明该注意力跟踪方法在大规模基准数据集上的性能表现优于现有的基于 - CVPR微扰神经网络
本文介绍了一种名为扰动层的替代卷积层的模块,通过实验证明这种扰动层可以有效地替代传统的卷积层,在多个视觉数据集上与标准 CNNs 性能相当,且拥有更少的参数。
- MM利用良好特征和多层感知器网络的人类动作识别系统
本文提出了一种新的方法,使用良好特征和迭代光流算法来计算特征向量,并使用多层感知器(MLP)网络进行分类,最终通过优化多层感知器网络的各种参数来提高系统准确性,从而解决了实时识别与跟踪人类动作的问题。