BriefGPT.xyz
Ask
alpha
关键词
interactive reasoning
搜索结果 - 5
链式侦测:交互推理提升大型视觉语言模型
介绍了一种名为 Chain-of-Spot(CoS)的交互推理方法,通过关注图像中与问题或指令相对应的关键区域(ROI),增强特征提取,提供了多粒度图像特征,从而显著提高了大型视觉 - 语言模型(LVLMs)在理解和推理视觉内容方面的能力。
PDF
4 months ago
VideoAgent: 基于大型语言模型的长视频理解
利用一个新型的基于代理的系统,以长篇视频理解为挑战,通过交互性推理和规划来处理长时间的多模式序列,同时使用大型语言模型作为中央代理来识别和编译关键信息以回答问题,视觉语言基础模型用于翻译和检索视觉信息。在具有挑战性的 EgoSchema 和
→
PDF
4 months ago
ECCV
使用 LEGO 积木实现交互式结构理解
通过使用 LEGO 积木,构建 LTRON 立体互动模拟器及 LEGO 创作数据集,利用 sequence-to-sequence 模型实现交互式推理,推动面向基础几何理解的研究。
PDF
2 years ago
CVPR
SAMPLE-HD: 同时动作和运动规划学习环境
本文提供了一个新的环境,用于学习交互式推理的视觉和行为方面的模拟,以掌握家庭用品的操作技能,并利用 SAMPLE-HD 环境生成场景、语言指令和训练路径。
PDF
2 years ago
AAAI
基于知识图谱的人类可理解事实核查的争论动态
提出了一种基于辩论动态的知识图谱事实检查新方法,利用强化学习代理抽取路径来论证事实真假,并通过二元分类器判断真假;该方法可解释用户决策,允许用户参与推理和评估辩论,提高各类基于知识图谱的人工智能应用的接受度、效率、稳健性和公正性。
PDF
4 years ago
Prev
Next