VolETA:一次和少量样本的食物体积估计
本文提出了一种名为MUSEFood的新方法,利用智能手机的摄像头、麦克风和扬声器结合多任务学习框架,旨在解决估算食物容量准确度差的问题。实验证明,MUSEFood可以高效地估算食物容量并具有比现有方法更好的性能。
Mar, 2019
本研究利用机器学习和计算机视觉技术,采用NutritionVerse-3D大规模高质量高分辨率数据集,开发了一种收集食品3D模型的方法,推进了营养感知的机器学习加速开放计划。
Apr, 2023
该论文针对 3D 模型渲染中的薄物体问题,提出了一种基于可区分重构的优化策略,该方法针对薄物体进行了优化,达到了更好的渲染效果。
Apr, 2023
通过使用单目图像进行三维形状重建,我们提出了一种端到端深度学习框架,用于从食物图像中估计食物能量,其在公开的食品图像数据集Nutrition5k上评估结果显示,我们的方法具有竞争力的性能,只需使用RGB图像作为推理阶段的唯一输入。
Aug, 2023
准确的膳食摄入估计对于支持健康饮食的政策和计划至关重要,然而,自我报告方法存在严重的偏倚。为了解决这个问题,本文介绍了NutritionVerse-Synth,这是第一个大规模的数据集,包含84,984张真实感合成的2D食物图像,以及相关的膳食信息和多模态注释。通过利用这些新颖的数据集,开发和评估了NutritionVerse,包括间接基于分割和直接预测网络的各种膳食摄入估计方法。最后,发布了这两个数据集(NutritionVerse-Synth、NutritionVerse-Real),作为加速机器学习在膳食感知方面的开放倡议的一部分。
Sep, 2023
营养素摄入估计的重要性和面向机器学习的营养感知的开放倡议在这篇论文中介绍了NutritionVerse-Real数据集的创建、分析和可用性。
Nov, 2023
本研究提出了一种新的框架,通过利用3D食物模型和场景中的物理参考,从2D图像中估计食物的容量和能量。该方法通过重现具有估计姿态的食物的3D模型图像,来估计输入图像中摄像头和食物物体的姿态。我们还介绍了一个新的数据集,SimpleFood45,其中包含45种食物的2D图像和相应的注释,包括食物的容量、重量和能量。我们的方法在这个数据集上的平均误差为31.10千卡(17.67%),表现优于现有的分量估计方法。
Apr, 2024
基于最新的3D重建技术,我们主办了“MetaFood Workshop”及其“Physically Informed 3D Food Reconstruction”挑战赛,针对从2D图像中使用可见棋盘作为尺寸参考,重建食物项目的体积准确的3D模型。这项挑战在食物重建方面取得了有希望的结果,并有助于改善膳食评估和营养监测的份量估计。
Jul, 2024
本研究针对现有3D数据集中缺乏营养价值的信息这一问题,提出了MetaFood3D数据集,涵盖637个精细标注的3D食品对象,包含108个类别及详细的营养信息。该数据集的创新之处在于其丰富的多模态信息,能够显著提升食品对象分析算法的性能,潜在地推动计算机视觉领域的研究进展。
Sep, 2024