BriefGPT.xyz
Ask
alpha
关键词
temporal sentence grounding in videos
搜索结果 - 3
多教师知识蒸馏下视频中高效的时间句子定位
本论文提出了一个基于知识蒸馏的新型高效多教师模型(EMTM),旨在在维持高性能的同时,实现在未修剪视频中检测自然语言查询所描述的事件时间戳的挑战。
PDF
a year ago
深入探讨视频中去偏置的时间句子定位:数据集、度量和方法
本文提出了一种新的视频文本时间对齐评估协议,包括将常用的数据集重新组织为不同的分布以及引入一种新的评估度量方法。此外,作者还提出了一种基于因果关系的多分支去偏置去混淆框架,帮助模型更好地对齐句子查询和视频片段的语义,实现了更好的性能。
PDF
2 years ago
视频中的时间句子定位:数据集和度量的深入探讨
本文主要研究 Temporal Sentence Grounding in Videos,在现有的评估协议中,重新组织两个广泛使用的 TSGV 基准及引入新的评估指标 dR @ n,IoU @ m 来校准基本的 IoU 分数,进一步监控 T
→
PDF
3 years ago
Prev
Next