Mar, 2019

V2CNet:视频翻译机器人操作指令的深度学习框架

TL;DR该研究提出了一种新的深度学习框架 V2CNet,用于自动将演示视频翻译成可直接用于机器人应用的命令。这个网络具有两个分支,分别用于编码视觉特征、序列化生成命令和学习精细行动。研究结果表明,V2CNet 在大规模数据集上的性能优于最新的其他方法,且其输出可以应用于实际机器人应用中。