- CaT-BENCH: 基准测试计划中因果和时间依赖的语言模型理解能力
通过引入 CaT-Bench 基准测试评估 LLMs 对步骤之间的因果依赖关系的理解能力,研究发现 LLMs 在此方面仍有改进空间。
- COLING基于深度学习的食谱命名实体识别模型
通过对三个数据集进行分析,我们发现进行了细粒度微调的 spaCy-transformer 成为最佳模型,对于手动注释、增强注释和机器注释数据集,它的宏 F1 分数分别为 95.9%、96.04%和 95.71%。
- 整数线性规划推理手册
本文介绍了如何使用整数线性规划将自然语言处理中的推理问题建模,并提供了实例和方法。
- 使用食谱的常识推理图形形式化方法
本文提出了一种图形化的方法对食谱进行形式化,其中捕捉了食材、中间食品和最终产品的组成以及在转化食材过程中的行为,并提出了比较食谱、从子食谱构建食谱、将食谱拆分为子食谱的形式化定义,并介绍和比较了两种替换食谱的形式化定义。
- CVPR通过测量动词 - 副词文本关系学习动作变化
本研究旨在预测视频中动作的副词,将问题转化为回归任务。作者通过测量动词和副词之间的文本关系,生成回归目标,并收集了一个新的高质量数据集:Adverbs in Recipes,评估了该方法并取得了优异的结果。
- 烤曲奇的 50 种方式:流程文本的映射
该研究提出了一种无监督学习方法,可将多个过程文本总结成直观的图形表示,用于探索任务的共性和差异,以帮助用户完成包括易于入门的菜谱修改和发掘烹饪创意等多种推理任务。
- 烹饪的生成语法
通过研究结构化菜谱的广泛存储库,我们识别出了共同的概念和规则,共同构成了一种烹饪综合系统的组合系统,提出了一种烹饪生成语法,为烹饪行为提供深刻的洞见,并提供了营养干预的杠杆。
- 基于生成式预训练转换器的高端餐饮食谱生成
该论文提出了使用 Transformer 结构的自回归语言模型的创新方法,利用少量的食谱数据集来识别烹饪技术,提出新颖的菜谱并测试最小数据微调的效果。
- TASTEset -- 食谱数据集与食品实体识别基准
介绍了一种新数据集(TASTEset),用于在处理食谱时识别各种实体(如食品产品、数量及其单位、烹饪过程名称、物理质量、目的和味道等)。我们提供了一些基于最先进的命名实体识别模型的基线,证明了我们的数据集对现有模型构成了良好的挑战。
- ACL创建用于序列任务的多模态对齐数据集的方法
通过使用无监督算法和图算法对文本和视频食谱的多模态数据进行对齐,研究了如何自动提取感性解释以说明现实世界中的复杂过程,构建了包含 4,262 道菜品的 Microsoft Research Multimodal Aligned Recipe - WWW网络探索全球饮食习惯
本研究分析了全球超过 200 种菜系的超过 157K 份食谱,并研究了这些食谱中的成分,口味和营养价值,以及它们与不同国家的健康指标之间的关系,结果表明地理和文化因素会影响全球不同地区的菜肴偏好与健康指标。