BriefGPT.xyz
大模型
Ask
alpha
关键词
visual question solving
搜索结果 - 1
Prism: 一个解耦和评估 VLM 能力的框架
Prism 是一个创新的框架,旨在解决视觉问题求解中构成的知觉和推理过程的相互交织难题,通过将感知和推理分离为两个不同的阶段,实现了对专有和开源 Vision Language Models 在感知和推理能力上的系统比较和评估。通过将专注于
→
PDF
14 days ago
Prev
Next