关键词visual object detection
搜索结果 - 7
- 一个简单的半监督学习框架用于目标检测
本文提出了一个简单而有效的 SSL 框架 STAC,以及一种数据增强策略,用于视觉物体检测;采用高置信度伪标签更新模型,通过强数据增强实现一致性约束,实验证明在 MS-COCO 和 VOC07 数据集上具备高效性和良好性能。
- FedVision:基于联邦学习的在线视觉目标检测平台
本文介绍了 “FedVision” 平台,它是一种用于支持基于联邦学习的计算机视觉应用程序开发的机器学习工程平台,该平台已经在智能城市应用程序的计算机视觉安全监控解决方案中得到了应用,并在四个月的使用中实现了较高的效率和成本降低。此外,该平 - 微小人物检测的比例匹配
本研究提出了一个名为 TinyPerson 的新基准,针对大规模图像中的微小对象(例如少于 20 像素的微小人物),引入了远距离和大背景下微小目标检测的有前途的方向,并且通过采用简单而有效的比例匹配方法,在避免特征表示和检测器退化的同时获得 - ECCV学习分离:检测城市场景中的严重遮挡物体
本文提出一种名为 SG-Det 的模型,使用一种新颖的嵌入机制来联合利用检测框的语义和几何特征,从而在面对类内遮挡较多的场景时显著提高了检测召回率,特别适用于城市场景的汽车和行人检测,在 KITTI 和 CityPersons 数据集上展示 - EMNLP基于多头注意力的多元化地位学习跨语言多模态表示
本文提出了一种基于视觉物体检测和不同文本语义的多语言多模态表示的模型,采用多头注意力机制对两种语言的文本语义和视觉对象进行细粒度对齐,从而学习到更好的视觉 - 语义嵌入空间,并在多个任务上展现了比其他方法更显著的性能提升。
- 视觉与无人机:一项挑战
本篇论文介绍了一个名为 VisDrone2018 的大规模视觉对象检测和跟踪基准,目的在于推进基于无人机平台上的视觉理解任务,其包含了 14 个不同城市的各种城市 / 郊区地区的图像和视频序列,并提供了丰富的标注,如物体边界框的位置,物体类 - 基于频谱图的音频事件时序定位的目标检测
本文提出了 “事件度” 的概念用于音频事件检测,并从视觉上类比为在频谱图中出现的物体检测问题,提出以在视觉中对象检测模型来解决单音或多音频事件检测问题并得出了与当前最先进水平相当的结果。