Jul, 2023

在道路上阅读:文本视频问答

TL;DR在驾驶员辅助环境下,通过提取和利用视频流中的视觉和文本线索以及时间推理,研究了场景文本识别和视频问答,以提升驾驶安全和多模态问题回答效果。