BriefGPT.xyz
大模型
Ask
alpha
关键词
language embedding
搜索结果 - 2
LiveScene: 语言嵌入交互式辐射场用于物理场景渲染和控制
通过将单一对象级别的交互式物体重建扩展到复杂场景级别,本研究旨在推进物理世界交互式场景重建的进展。为了准确模拟复杂场景中多个物体的交互运动,我们提出了 LiveScene,即第一个嵌入场景级语言交互式神经辐射场,它能够高效重建和控制复杂场景
→
PDF
11 days ago
ECCV
视频检索的多模态 Transformer
本文提出了一种基于多模态 transformer 架构的视频检索方法,该方法能够充分利用视频中的跨模态线索,并融合先前的时间信息。我们还研究了联合优化语言嵌入和多模态 transformer 的最佳实践。该方法在三个数据集上取得了最新的视频
→
PDF
4 years ago
Prev
Next