Jan, 2023

基于混合深度学习技术 (CNN+GRU) 的图像字幕算法

TL;DR本篇论文主要介绍了一种基于 CNN-GRU 编码器 - 解码器框架的图像描述生成模型,相较于常用的 CNN-LSTM 模型,该模型考虑了图片的语义信息和时间复杂度,且在时间复杂度和准确性上优于目前最先进的 LSTM-A5 模型。