BriefGPT.xyz
Ask
alpha
关键词
neural interface
搜索结果 - 1
视频聊天:以聊天为中心的视频理解
本研究介绍了一种以视频为中心的语音理解系统 VideoChat,它通过可学习的神经接口将视频基础模型和大型语言模型集成起来,在时空推理、事件定位和因果关系推断等方面表现出色。通过使用视频为中心的指令数据集,我们为这个系统提供了有指导性的调整
→
PDF
a year ago
Prev
Next