Jul, 2024

知识蒸馏以从包含多个对象的图像中有效获取感兴趣区域和全局语义

TL;DR使用卷积神经网络和Transformer模型,在对象检测任务中通过ROI区域分割和蒙版,结合全局上下文,成功实现准确分类食物图片,同时提高模型的鲁棒性。