利用合成图像训练商业烘焙行业的计算机视觉模型
本文介绍了一种包含5,000张超过25种不同杂货类别的图像数据集, 可用于机器学习和机器人研究的训练、测试和引导。研究者基于这个数据集训练了一个基线分类器,得到了78.9%的平均准确率。
Nov, 2016
为产物察觉问题而深入研究超市图像和其他自然图像中目标提议生成。为了更好地生成目标提议,本文提出了一种名为 ScaleNet 的方法来估算图像中目标的比例,并体现了其有效性。
Apr, 2017
本文提出了一种通过将烹饪配方和食品图像表示为烹饪程序来建模如何指导说明性程序(如烹饪食谱),并展示了使用自我监督和联合嵌入生成程序的可行性,从图像生成食品图像,这使得跨模态检索效果更佳。
Mar, 2022
FoodSAM是一种创新的框架,整合了粗糙的语义掩膜和SAM生成的掩膜,以提高语义分割质量,并将零样本能力扩展到实例分割和全景分割,是首个在食品图像上实现实例、全景和可提示分割的工作。
Aug, 2023
该研究提出了一种针对食品计算领域的新型多模态方法(FIRE),该方法基于输入的食品图像生成食品标题、配料和烹饪说明,并展示了与大型语言模型提示结合的两个实际应用:将食谱个性化以适应用户偏好和将食谱转化为代码以实现自动化烹饪过程。实验结果验证了该方法的有效性,并强调其在食品计算领域的未来发展和广泛应用潜力。
Aug, 2023
当代社会中,运用人工智能进行自动食品识别在营养追踪、减少食物浪费以及提升食品生产和消费效率等方面具有巨大的潜力。该研究使用预训练的MobileNetV2模型,结合多种技术手段,提高了食品识别的性能和鲁棒性,从而可应用于实际应用中。
May, 2024
使用机器学习应用程序 Semmeldetector,可以利用目标检测模型在图像中检测、分类和计数烘焙食品。我们的应用程序允许商业烘焙师跟踪未售出的烘焙食品,从而优化生产并提高资源效率。通过编制包含1151张图像的数据集,可以区分出18种不同类型的烘焙食品来训练我们的检测模型。为了促进模型训练,我们使用了一个复制粘贴的增强流水线来扩展我们的数据集。我们在检测任务中使用了最先进的目标检测模型 YOLOv8 进行训练。我们测试了不同训练数据、模型规模和在线图像增强流水线对模型性能的影响。我们最佳的模型在测试集上达到了89.1%的[email protected]。基于我们的结果,我们得出结论,机器学习即使在像烘焙行业这样的未预见行业中,也可以成为有价值的工具,即使数据集非常有限。
Jun, 2024
本研究解决了现有食品计算研究中缺乏多模态整合的问题,提出了一种新型的食品计算基础模型ChefFusion,能够同时处理食谱生成、食品图像生成等多项任务。该模型通过结合大语言模型和预训练图像编码解码模型,展现了显著的性能提升,尤其在食品图像生成和食谱生成领域具有广泛的应用价值。
Sep, 2024