数据集营养标签(第2代):利用上下文减轻人工智能的危害
该研究通过引入Nutrition5k数据集, 采用计算机视觉算法能够精确预测真实世界中的复杂菜肴的热量和营养素值,并且具有超过专业营养学家的准确性,使这一领域的营养理解得到加速创新。
Mar, 2021
本文提出一种基于数据驱动的主动标签清理方法来解决数据注释中的标签噪音问题,通过对样本进行优先级排序,提高数据集质量,具有较好的可行性和高效性。
Sep, 2021
本文介绍了 Healthsheet,一种针对健康特定应用的数据表。该工具的目的是改善关于机器学习健康数据集的创建、使用和维护的文献记录实践。实验研究表明,针对健康特定应用的数据表是很有必要和重要的,并且需要针对特定的应用场景进行具体化和优化。同时,如果更多的文献记录实践能够采用数据表,这将有助于保障机器学习在健康领域应用的公平性和客观性。
Feb, 2022
本研究利用机器学习和计算机视觉技术,采用NutritionVerse-3D大规模高质量高分辨率数据集,开发了一种收集食品3D模型的方法,推进了营养感知的机器学习加速开放计划。
Apr, 2023
本研究使用最先进的合成数据生成方法并对在营养学领域的特定用例中生成的数据进行深入的质量分析,展示了对合成数据进行仔细分析的必要性,并通过扩展方法,全面分析从训练模型中抽样的效果,从而在所选择的用例中基本复现了重要的真实世界分析结果。
May, 2023
运用人工智能(AI)和可解释的AI(XAI)技术,研究开发了一种新型的基于异质m-health数据的早期和可解释的营养不良风险检测框架,并通过临床验证验证所学习到的特征-输出趋势与当前基于证据的评估符合。
May, 2023
本文论述大型语言模型的出现产生了对定制机器学习模型的革命,并引发了有关重新定义数据要求的讨论,讨论和期望,即在监督学习时代,人类水平标记干预的重要性可能不再具有相同的重要性,并提出支持在LLM时代继续使用人工标记数据的有力论点。
Jun, 2023
使用大型语言模型,结合众包工人和营养专家,在缺乏公共资源的营养咨询领域,成功地聚集了一系列高质量的数据集,并通过专家评估得出,ChatGPT生成的文本在流畅度和人类化方面表现出色,但在敏感话题(如心理健康)中存在不利行为,不适合无监督使用。
Jan, 2024
营养素摄入估计的重要性和面向机器学习的营养感知的开放倡议在这篇论文中介绍了NutritionVerse-Real数据集的创建、分析和可用性。
Nov, 2023
准确的营养估计有助于人们做出明智的饮食选择,并在预防严重健康问题方面至关重要。我们介绍了NutriBench,这是第一个基于自然语言的餐饮描述的公开营养基准。NutriBench包括5,000个经人工验证的餐饮描述,附有宏量营养标签,包括碳水化合物、蛋白质、脂肪和卡路里。数据分为15个子集,根据餐饮中食物项目的数量、份量和受欢迎程度以及份量描述的特定性而变化。我们对七个流行的和最先进的大型语言模型进行了广泛评估,包括GPT-3.5、Llama-3和一种医学领域特定模型,采用标准的思考链和检索增强生成策略用于我们的碳水化合物估计基准。我们还进行了一项涉及专家和非专家参与者的人员研究,并发现LLMs可以在各种复杂查询中提供更准确和更快速的预测。我们对不同LLMs进行了彻底的分析和比较,并突出了在实际场景中使用LLMs进行营养估计的机会和挑战。我们的基准公开可用于此链接地址。
Jul, 2024