Feb, 2024

轻量级像素差异网络用于高效视觉表示学习

TL;DR提出两种新型卷积方法Pixel Difference Convolution(PDC)和Binary PDC(Bi-PDC),以及两个轻量级深度网络PiDiNet和Bi-PiDiNet用于视觉任务,如边缘检测和目标识别。在BSDS500、ImageNet、LFW和YTF等数据集上进行的广泛实验表明,PiDiNet和Bi-PiDiNet在准确性和效率之间取得了最佳的平衡。对于边缘检测,PiDiNet是第一个可以在没有ImageNet的情况下进行训练的网络,在BSDS500上以100 FPS和小于1M参数实现了与人类水平相当的性能。对于目标识别,Bi-PiDiNet在现有的二进制DNN中取得了最佳准确性,并在ResNet18上将计算成本减少了近2倍。