BriefGPT.xyz
Ask
alpha
关键词
cooking actions
搜索结果 - 2
基于风格转移的语音和视觉场景理解,用于机器人从视频中获取操作序列
本文介绍一种从指令视频中生成机器人动作序列的方法,用于实现人机协作,并展示了该方法在各种烹饪动作中的成功率达到 32%。
PDF
a year ago
COLING
Visual Recipe Flow:一份用于学习物体视觉状态变化的食谱流数据集
提出了一个名为 Visual Recipe Flow 的多模态数据集,它能够学习菜谱文本中每个烹饪动作的结果,该数据集由物体状态变化以及菜谱文本的工作流程组成,其使用一个菜谱流程图来表示工作流程并使用图像对来表示状态变化,可用于多模态常识推
→
PDF
2 years ago
Prev
Next