- 揭示潜力:利用深度度量学习绕过视频流加密
基于深度度量学习的三元损失方法,我们提出了一个健壮、通用、可扩展和可转移的加密视频流检测框架,总结表明这种侧信道攻击的适用范围比最初想象的更广。
- 基于外貌的目标中心运动分割优化
通过引入外观优化方法和视频流的时间一致性,我们提出了一种能够独立发现、分割和跟踪复杂视觉场景中独立移动物体的方法。该方法通过简单的选择机制识别准确的光流预测掩码,并基于示例信息优化有问题的掩码。我们的模型在多个视频分割基准上的性能表现验证了 - 基于点云融合的时序一致在线深度估计
本篇论文提出了一种使用全局点云和图像空间中的学习融合方法来解决视频深度图像序列估计中的时间一致性问题,并可以有效处理动态目标。实验结果展示该方法达到了最先进的视频深度图像序列一致性估计质量。
- 机器学习技术预测视频流量以降低云服务成本
提出算法对云存储仓库中不同视频流的受欢迎程度进行预测,根据预测结果决定是否从云存储中删除某些视频以降低存储成本,结果表明与保存所有视频流相比,云服务的成本降低了 15%。
- ICLR学习是什么和在哪里:无监督分离位置和身份跟踪
介绍了一种被称为 Loci 的自监督位置和身份追踪系统,通过处理分离的 “何处” 和 “何物” 的槽状编码解决了绑定问题,可以从视频流中有效地提取对象并将其分离成位置和整体组件,从而在概念层面上促进了有效的规划和推理。
- CVPR高效视频处理的跳跃卷积
通过 Skip-Convolutions 算法,有效利用视频流的时间冗余,将所有卷积替换成 Skip-Convolutions,可以将计算成本降低 3 至 4 倍,同时不会降低准确性,从而显著提高模型压缩和图像效率。
- ECCV学习预测显著面孔:一种新的视听显著性模型
本文通过建立大规模的多人面部视频音频条件下的视线跟踪数据库,研究声音对多人面部视频视觉线索的影响,并提出了一种新的多模式视频显着性模型,包括三种分支:视觉,音频和面部,实验结果表明该方法胜过 11 种现有的显着性预测方法。
- ICCV基于流等变性的自监督表征学习
在视频流的场景中,通过流变换目标使神经网络预测另一个帧的特征,实现了一种新的自我监督学习表示框架,学习到的高分辨率原始视频表示可用于静态图片的下游任务,例如语义分割、实例分割和目标检测,超越了 SimCLR 和 BYOL 等先前最先进算法得 - 从机器人的角度进行连续参与评估,你还在吗?
通过使用 CNN 和 LSTM 网络,我们提出了一种新的回归模型,能够从标准视频流中计算出机器人与人类互动过程中的单一测量值,以衡量参与度,并在不同环境下成功应用。
- 毫秒级别的滚动快门相机同步
提出一种简单方法,可将视频流同步精度提高到 1 毫秒以下,并适用于任意数量的快门滚动相机,同时利用快门滚动传感器的特性来实现,使摄像机可以具有不同的帧速率和分辨率,无需重叠视野。对冰球比赛中的四个视频流进行的 5 分钟验证显示,将在所有相机 - ICCVR-C3D:用于时序活动检测的区域三维卷积网络
我们提出了一种基于 R-C3D 模型的视频流活动检测方法,通过提取关键的时空特征来定位和分类实现高效监测,该模型具有端到端的训练方式和较快的运行速度,在多个数据集上取得了最佳的效果。
- OpenCFU,一款用于计数细胞菌落和其他圆形对象的新免费开源软件
研究生产了一个名为 OpenCFU 的软件,用于自动计数数字图片和视频流中的圆形物体,该软件具有很强的鲁棒性,准确性和速度,并提供对处理参数的控制和直观的现代界面。