FoodNet: 使用深度神经网络集成识别食物
本研究提出了一种新的基于 Convolutional Neural Networks (CNNs) 的两步骤食物识别系统,其中包括基于 Faster R-CNN 方法的食物定位和用于执行基于视图关联的分类任务的多任务 CNN 模型,该模型能够自动生成表达食物类别语义视觉关系的层次结构。实验结果表明,该系统在 4 个公开数据集和新的 VFN 数据集上均可以显著提高分类和识别性能。
Dec, 2020
研究了自动饮食评估系统中视觉识别食物的核心功能,使用深度多标签学习方法评估了几种最先进的神经网络,以在图像中检测任意数量的成分,并针对编码使用了多个著名的神经网络模型。在使用挑战性数据集 Nutrition5K 上,取得了有希望的初步结果,并为未来的探索奠定了坚实的基础。
Oct, 2022
通过构建一个 5822 张图片数据集并使用五层 CNN 网络结构,利用几何变换的数据扩充技术来提高训练图片的数量,利用支持向量机(SVM)和 Bag-of-features(BoF)来进行食品图片识别,最终达到超过 90% 的准确率,有效避免 CNN 过度训练问题。
Dec, 2016
本研究旨在通过分析移动设备(如智能手机)捕获的食物图像来改进膳食评估的准确性,提出了一种新的基于卷积神经网络的食品图像识别算法,并将该方法应用于两个真实数据集(UEC-256 和 Food-101)中,取得了令人瞩目的结果。
Jun, 2016
介绍了一个名为 “ChineseFoodNet” 的新型大规模食品图像数据集,旨在自动识别中国菜;该数据集包含 208 类别的 18 万多个食品照片,通过使用深度卷积神经网络与投票方法的机器学习方法,该方法在验证集和测试集分别达到了 81.43%和 81.55%的 top-1 精度。
May, 2017
当代社会中,运用人工智能进行自动食品识别在营养追踪、减少食物浪费以及提升食品生产和消费效率等方面具有巨大的潜力。该研究使用预训练的 MobileNetV2 模型,结合多种技术手段,提高了食品识别的性能和鲁棒性,从而可应用于实际应用中。
May, 2024
本篇论文提出了一种新的深层神经网络结构,通过对食物构成的分析提出了切片卷积块来捕捉垂直的食品层,将深度残差网络的输出与切片卷积相结合来产生特定食品类别的分类得分,并在三个基准数据集上进行实验,展示了与现有方法相比更好的性能。
Dec, 2016
提出一种使用 EfficientNet 的改进版本和 Mish 激活函数进行图像分类的多模态分类框架,并使用传统的基于 BERT 的文本分类网络。在大型开源数据集 UPMC Food-101 上评估了提出的网络和其他最先进的方法,实验结果表明,与排名第二的方法相比,提出的网络在图像和文本分类上的准确率分别提高了 11.57% 和 6.34%。同时,通过使用机器学习和深度学习模型进行文本分类的准确率、精确度和召回率性能比较分析,证明了所提出方法的效率和鲁棒性。
Aug, 2023
本文提出了一种利用深度卷积神经网络学习特征进行文档图像分类和检索的最新技术,证实与手工制作的替代方法相比,能够更好地学习抽象特征,且具有压缩鲁棒性和跨领域迁移性,并在新的 IIT-CDIP 数据集中提供了 400,000 个文档图像用于深度学习。
Feb, 2015