Apr, 2024

通过三维物体缩放进行食物容量估计

TL;DR本研究提出了一种新的框架,通过利用3D食物模型和场景中的物理参考,从2D图像中估计食物的容量和能量。该方法通过重现具有估计姿态的食物的3D模型图像,来估计输入图像中摄像头和食物物体的姿态。我们还介绍了一个新的数据集,SimpleFood45,其中包含45种食物的2D图像和相应的注释,包括食物的容量、重量和能量。我们的方法在这个数据集上的平均误差为31.10千卡(17.67%),表现优于现有的分量估计方法。