BriefGPT.xyz
Ask
alpha
关键词
iterative loop
搜索结果 - 2
DrVideo: 基于文档检索的长视频理解
我们提出了 DrVideo,它是一个基于文档检索的系统,用于长视频理解。我们的关键思想是将长视频理解问题转化为长文档理解任务,以有效利用大型语言模型的能力。通过将长视频转化为基于文本的长文档来检索关键帧并增强这些帧的信息,然后采用基于代理的
→
PDF
18 days ago
SECP: 基于语音增强的清晰语音可扩展采集过程
简化后:本文提出了一种基于语音增强的策划管道(SECP)框架,旨在最小化对人工听力和注释的依赖,通过两个迭代循环的运行,观察到使用增强输出作为基本真实性的模型性能不降低,并通过主观测试表明改进数据的最高和最低边界比原始数据更具感知效果。
PDF
5 months ago
Prev
Next