EMNLPDec, 2023
DemaFormer:具有能量建模的阻尼指数移动平均变压器用于时序语言基础生成
DemaFormer: Damped Exponential Moving Average Transformer with Energy-Based Modeling for Temporal Language Grounding
Thong Nguyen, Xiaobao Wu, Xinshuai Dong, Cong-Duy Nguyen, See-Kiong Ng...
TL;DR时序语言定位是为了找出语义上与自然语言查询相对应的视频片段。该研究提出了一种基于能量的模型框架和 DemaFormer,一种新颖的基于 Transformer 的架构,用于有效地学习时序语言定位。实验证明我们的方法在四个公开的时序语言定位数据集上优于最先进的基线方法。