BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal intelligence
搜索结果 - 3
Agent AI:多模态交互视野调查
多模态人工智能系统中,基于 Agent 的多模态智能研究,通过在真实和虚拟环境中嵌入具有感知能力的智能体,能够处理和解释视觉和语境数据,以提高智能系统的上下文感知和交互能力。
PDF
6 months ago
视觉 - 语言预训练:基础、最新进展和未来趋势
本文研究多模态智能领域的视觉 - 语言预训练方法,分为三类分类,包含图像 - 文本、核心计算机视觉和视频 - 文本任务,针对每类任务,提出了针对性的方法,分别探究了研究进展和存在的挑战并讨论了更先进的主题。
PDF
2 years ago
多模态智能:表示学习、信息融合与应用
本文综述了多模态智能领域中的各种模型和学习方法。主要关注点是视觉和自然语言模态的组合,涵盖了多模态表示学习、多模态信号融合以及多模态应用等方面,旨在为相关社群未来的研究提供参考。
PDF
5 years ago
Prev
Next