BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal puzzle solving
搜索结果 - 1
语言模型是否是解谜天才?算法解谜揭示多模态推理中的严峻挑战
这篇论文介绍了一项新颖的任务,即多模式拼图解决,其框架是视觉问题回答。我们提出了一个名为 AlgoPuzzleVQA 的新数据集,旨在挑战和评估多模态语言模型在解决需要视觉理解、语言理解和复杂算法推理的算法拼图中的能力。我们的研究表明,GP
→
PDF
4 months ago
Prev
Next