本文提出了一种基于视觉语言神经网络模型的 UMDFood-VL 模型,并利用最全面的 UMDFood-90k 多模态食品数据库,相较于传统的卷积神经网络(CNNs)和循环神经网络(RNNs),在各种营养价值估计上显著提高,尤其是在食品成分估计上取得了 95%的宏平均 AUCROC,具有一定的实际应用价值。
May, 2023
该研究通过引入 Nutrition5k 数据集,采用计算机视觉算法能够精确预测真实世界中的复杂菜肴的热量和营养素值,并且具有超过专业营养学家的准确性,使这一领域的营养理解得到加速创新。
Mar, 2021
现有的大规模语言模型建设通常是在基础模型上进行微调,有些模型还会融入知识库而不需要预训练。本文提出了一种增量预训练方法来处理结构化知识和扫描文档,通过构建知识图谱作为外部知识库,旨在解决大规模语言模型中的机器幻觉问题。
Aug, 2023
这篇文章概述了创建和管理大型知识库的基本概念和实践方法,重点介绍了发现和规范实体及其语义类型、自动提取基于实体的属性以及构建开放架构和知识管理的方法。
Sep, 2020
本文探究使用与食品相关的语料库对预训练基于 Transformer 的语言模型进行预训练的有效性,并利用外部知识源,如 FoodOn 本体论,对此任务进行微调,提出使用基于 GPT 模型作为基线和利用 ChatGPT 作为外部知识源进行研究的两个新途径,同时扩展了本研究的范围,探讨了其他自然语言处理任务。
Jun, 2023
该研究提出了基于本体的知识映射模型,以表示和存储作物种植的数据挖掘结果,以建立、维护和丰富知识发现过程,从而实现更高效的决策过程。
Jul, 2022
本文提出了一种新颖的跨模态学习框架来自动发现食谱中文本和图像的实体及其相应的重要性,并能在没有明确监督的情况下识别出食谱描述中的主要成分和烹饪动作,为跨模态检索和食谱适应任务提供更有意义的特征表示。
Feb, 2021
该研究通过使用大型语言模型,在科学文献中自动提取化学危害物,以实现食品安全领域的信息提取。最佳提示方法将任务分解为较小的步骤,平均准确率达到 93%,证实了大型语言模型在从科学文献中提取相关危害物方面的价值。
May, 2024
提出了一种基于大规模食品知识图谱和健康指南的个性化饮食推荐框架,将用户查询、饮食偏好和健康指南作为自然语言问答系统的约束条件,用于促进用户养成健康的饮食习惯。
Jan, 2021
研究了自动饮食评估系统中视觉识别食物的核心功能,使用深度多标签学习方法评估了几种最先进的神经网络,以在图像中检测任意数量的成分,并针对编码使用了多个著名的神经网络模型。在使用挑战性数据集 Nutrition5K 上,取得了有希望的初步结果,并为未来的探索奠定了坚实的基础。
Oct, 2022