BriefGPT.xyz
Ask
alpha
关键词
automatic video description
搜索结果 - 3
复杂操作动作视频的多句描述
提出了一种混合统计和端到端框架来解决视频描述中细节级别、操作行为和层次结构的问题,并且定量结果表明这些方法产生的描述比其他竞争方法更真实。
PDF
8 months ago
TennisVid2Text: 面向特定领域视频的细粒度描述
本文针对草地网球赛的广播录像,利用从互联网上获得的人类创造的描述生成丰富的语义描述,形似于体育网站上专家人类写的文本评论,经测试能提供准确性和可读性。
PDF
9 years ago
具有可变细节级别的连贯多句视频描述
本文介绍了一种通过从视频中学习语义表示(SR)并以 SR 为基础来生成多句连贯的自然语言描述的方法,同时也提出了基于手的视觉识别方法以及利用词格进行句子生成的方法,并通过人类评价证明了该方法比现有相关工作能够生成更可读、准确和相关的描述。
PDF
10 years ago
Prev
Next