- 基于 Transformer 的地标检测:面向机器人辅助鼻气道插管
本文提出了一种基于变形 DeTR 和语义对齐匹配模块的基于 Transformer 的标志检测解决方案,用于检测机器辅助气道插管中的标志。实验结果表明我们的解决方案在检测准确性方面具有竞争力。
- 大型语言模型的私有水印
我们提出了第一种私有水印算法,通过使用两个不同的神经网络进行水印生成和检测,扩展了当前的文本水印算法,而不是在两个阶段都使用相同的密钥,实现了高效准确地检测网络,并且对生成和检测速度影响小。
- AI 自动生成文本的可证明鲁棒水印
为了解决检测人工智能生成文本的问题,本研究提出了一种鲁棒且高质量的方案,名为 GPTWatermark,通过水印的方式确定文本的来源,并在大规模语言模型中展示了其稳定性和高检测准确性。
- EfficientSRFace: 一种高效的具有超分辨增强的网络,用于准确的面部检测
为解决深度人脸检测在低分辨率人脸检测中的性能问题,本文提出了一种新的高效检测器 EfficientSRFace,引入了特征级超分辨率重建网络,并在公共数据集 FDDB 和 WIDER Face 上取得了与现有算法相当的检测性能结果。
- CVPR检测预训练编码器中的后门
本文提出了 DECREE,是第一个用于预训练编码器的后门检测方法,无需分类器头或输入标签,并通过对 400 多个遭受三种范式攻击的编码器的评估,在 ImageNet 和 CLIP 400 百万图像文本对上,我们的方法一致具有很高的检测准确性 - 基于深度学习的物联网设备识别方法
该研究应用深度学习来自动识别组织内允许接入的 IoT 设备,以增强网络安全。相较于现有的方法,该方法不需要对网络通讯进行复杂的特征工程,而是通过生成设备通讯负载的小图片来表征 IoT 设备的通信行为。该方法可适用于任何协议的 IoT 设备, - ICCV选取 PointPillars 主干类型以实现快速准确的 LiDAR 物体检测
本研究探讨了深度卷积神经网络背骨选择对于基于 LiDAR 传感器数据的 3D 目标检测精度和计算速度的影响,测试了 10 种不同的卷积神经网络架构,并在保证检测效率(以 mAP 度量)的前提下,显著提高 LiDAR 点云中 3D 物体检测速 - 通过潜在预测编码实现快速准确的多变量时间序列异常检测
LPC-AD 是一种快速而精确的多元时间序列异常检测方法,通过降低训练时间和提高检测准确度来提升性能,利用 autoencoder、latent predictive coding 等思想构建了通用架构 LPC-Reconstruct,实现 - CVPR目标检测评估的最优纠错成本
我们提出了一种名为 OC-cost 的方法,它通过解决检测和实际情况间的最佳传输问题来度量检测器的准确性,避免了 mAP 只能从排序检索方面评估的缺点。与 mAP 相比,OC-cost 更加准确和公平,能够提供一个额外的度量工具来评估检测器 - CVPR密集标签编码用于无边界不连续旋转检测
本文提出了一种基于分类的旋转检测方法,采用两种密集编码标签替换了传统稀疏编码标签,配合损失重加权的策略,有效地提高了分类检测器的训练速度和检测准确率,适用于航拍图像、场景文本和面部等多种视觉应用。
- CVPR学习统一的样本权重网络进行目标检测
该研究提出了一种基于样本权重网络的通用损失函数和样本权重预测方法,能够有效地提高基于区域的物体检测器的检测准确率。
- KDD使用纳什强化学习实现强韧的垃圾用户检测
以极小化极大博弈为基础,利用依赖性马尔可夫决策过程(MDP)优化算法,定位鉴定在提高商品评价的真实性方面表现更优秀的网络欺诈检测与防范方法。
- LiDAR 点云 3D 物体检测的端到端多视角融合
本文提出了一种新颖的多视角融合算法 (MVF),它能够从鸟瞰视角和透视视角有效地学习利用互补信息,其中采用了动态体素化方法。在 Waymo 开放数据集和 KITTI 数据集上的评估表明,MVF 模型显著提高了检测精度。
- 网络入侵检测的迁移学习方法
本文提出了一个使用转移学习的 ConvNet 模型,用于网络入侵检测,实验结果表明该模型可以提高检测准确度,不仅在主要攻击已知的测试数据集上(KDDTest +),而且在包含许多新攻击的测试数据集上(KDDTest-21)也有显着提升 -- - ICCV一种视频物体检测的延迟度量:平均精度所不能说明的
通过分析视频物体检测的时序特征,本文指出平均精度(AP)无法充分反映视频物体检测的实际情况,提出了一种全面的度量准则 —— 平均延迟 (AD),并从 ImageNet VIDT 数据集上证明了大多数方法虽然能保持平均精度不变,但其检测时延却 - 基于张量嵌入的半监督内容谣言检测
该研究针对含有大量内容的新闻文章,提出了一种基于内容检测伪新闻的方法,使用多维张量分解得到每篇文章的嵌入特征,并通过在文章之间创建图来传播有限标签,实验结果表明该方法能够使用更少的标签实现更好的检测精度。
- CVPR大型图像快速目标检测的动态缩放网络
本文提出了一种基于强化学习的通用框架,对于出现在高分辨率图像中的各种大小的物体进行检测,可以减少计算成本并保持准确性;实验结果表明,与传统方法相比,可以减少处理像素的数量达 50%,而不会降低检测精度。
- 单次拍摄的时间动作检测
该研究提出了一种基于 1D 时间卷积层的单次动作检测器(SSAD)网络来直接检测未修剪视频中的动作实例以提高检测精度。在改进检测精度的过程中,它探讨了输入特征类型和融合策略,并在两个具有挑战性的数据集上进行了广泛的实验,证明了在 THUMO - 上下文感知型单 - shot 检测器
CSSD 是一种基于 SSD 的多尺度上下文感知单发多框物体检测器,通过添加上下文层在检测小物体时取得了较好的效果。
- 使用卷积神经网络预测观众笑声
本文研究幽默识别,并使用语言学知识与卷积神经网络方法进行比较。结果显示,基于卷积神经网络的方法可以自动学习基本特征,提高了识别准确性。