Oct, 2022

TLDW: 新闻视频的极端多模态摘要

TL;DR介绍了一种新的极端多模式汇总方法(XMSMO),主要采用 HOT-Net 框架实现多模态输入到多模态输出的文本、图像总结,以解决信息过载问题。