MMAug, 2023

AdaBrowse: 自适应视频浏览器以提高连续手语识别效率

TL;DR提出了一种新的自适应模型(AdaBrowse),通过将连续手语识别(CSLR)问题建模成顺序决策任务,动态选择输入视频序列中最具信息量的子序列,并利用时空冗余实现高效计算,对四个大规模 CSLR 数据集进行了广泛的实验,证明了 AdaBrowse 的有效性。