Nov, 2022

基于句子级的手语识别框架

TL;DR本文提出了两种解决方案来解决句子级手语识别问题,并通过使用连接主义时间分类(CTC)作为两种模型的分类器层,介绍了 LRCN-based 模型和 Multi-Cue 网络的工作原理。在评估了 RWTH-PHOENIX-Weather 数据集后,作者通过进行超参数搜索,包括特征图数量、输入大小、批量大小、序列长度、LSTM 内存单元、正则化和失活等,获得了 35% 的字词错误率(WER)。