Jun, 2024

一种用于密集多标签动作检测的有效高效方法

TL;DR通过在转换器层中嵌入相对位置编码和非分层结构来解决密集多标签场景下同时学习时间依赖和共现动作关系的挑战,并通过引入一种新的学习范式,以在推断期间不施加额外计算成本的方式显式建模时间共现动作依赖性。