- 培育多智能体合作的认知洞察与稳定联盟匹配
我们提出了一种新的匹配联盟机制,利用不同 ToM 水平的智能体的优势,明确考虑信念一致性和专门能力,在形成联盟时寻找最大程度促进合作行为并确保长期可行性的稳定联盟,从而将 ToM 应用于设计多智能体系统,提供更复杂和类似于人类的协调策略,促 - 个性化的遗忘机制与概念驱动的知识追踪
知识追踪旨在通过分析学生的历史学习数据并预测其未来学习表现,跟踪学生知识状态的变化。本文提出了一个概念驱动的个性化遗忘知识追踪模型(CPF),该模型整合了知识概念之间的层次关系,并结合学生个性化的认知能力,以解决现有遗忘曲线理论模型只考虑时 - 大型视觉语言模型的图像推理与描述的认知评估基准
通过使用具有丰富语义的图像,我们提出了一种新的评估基准,评估大规模视觉语言模型(LVLMs)的高级认知能力。该基准定义了八种推理能力,并包括图像描述任务和视觉问答任务。我们对知名的 LVLMs 进行评估发现,LVLMs 与人类之间的认知能力 - 通过特征选择和声学词袋模型鉴别口语语言中的认知衰退
记忆障碍是老年人功能和日常活动衰退的核心因素。该研究采用自动特征选择和机器学习技术,通过语音分析来诊断认知能力下降和痴呆症患者,取得了高于国际研究水平的分类准确度。
- 解码障碍:大型语言模型与人类问题解决者
大型语言模型在解决难题方面表现出色,但人类参与者在验证解决方案方面展现出更高的技能,该研究增进了我们对大型语言模型认知能力的理解,为提升其在各个领域中的问题解决潜力提供了启示。
- 越少越好:基于基础模型的零样本局部场景图生成
通过 ELEGANT 框架,利用视觉感知、场景图生成和认知能力,提出了局部场景图生成的新任务,并通过与基础模型之间的协作和信息传递实现了零样本的局部场景图生成,从而展示了其强大的推理能力。
- 大型语言模型中的自信 - 能力差距:一项认知研究
研究通过对大型语言模型(LLMs)的认知能力和置信度动态的深入了解,揭示了模型中展现高置信度但回答错误的情况,类似于人类心理学中的邓宁 - 克鲁格效应,以及低置信度但回答正确的情况,展示了潜在的低估偏差,强调了对这些语言模型认知过程的深入研 - 为何我们尚未拥有通用人工智能
人工通用智能(AGI)是构建 “思考机器” 的愿景,与 “狭义人工智能” 方法形成鲜明对比。本研究指出了纯统计方法无法实现 AGI,同时确定了实现类似人类适应能力和自主学习所需的关键认知能力,并总结了阻碍 AGI 进展的社会技术因素。
- LLM 认知能力的高效测量:自适应测试视角
提出了一种采用自适应测试框架评估大型语言模型的方法,该方法可以根据模型的表现动态调整测试问题的难度,从而更准确地估计模型的能力,使得大型语言模型可以与人类进行比较,同时该方法可以使用更少的问题,从而更加高效。对 ChatGPT 等 6 种模 - 评估 ChatGPT 的工作记忆容量
本研究探讨了 ChatGPT 的工作记忆容量,并比较了其在口头和空间 N-back 任务中的表现。研究结果表明,在人类智能与 AI 发展中,对人类工作记忆的理解对于开发智能系统至关重要,并且 AI 模型可以加深我们对人类工作记忆的认识,促进 - 通过语言进行视觉抽象和推理
本研究提出了一种基于自然语言描述任务的方法框架来解决人工智能中的 Abstraction and Reasoning Corpus (ARC) 问题,虽然尚未击败当前最先进的 DSL 模型,但我们证明了我们的方法具有巨大的潜力,可以解决以前 - 大型语言模型中语言和思维的分离:认知角度
今天的大型语言模型 (LLMs) 可以生成连贯的,符合语法的、有意义的文本段落,但在如人类思维一样的实际语言使用中,大多数测试需要功能语言能力,从认知神经科学的证据中,我们显示出 LLMs 显示出令人印象深刻(虽然不完美)的正式语言能力的任 - 机器人认知架构的记忆系统及其在 ArmarX 中的实现
本论文针对认知机器人控制架构中的知识管理问题,提出了一种支持感知运动表示和语义表示之间中介和提供数据驱动服务的内在记忆结构,并且对基于该结构的 ArmarX 机器人软件框架进行了评估。
- MM人类行为建模 Part II -- 认知方法与不确定性
本文讨论以人类认知能力、局限性和偏见为基础的学习方法,并介绍一些方法来产生和利用对人类决策或未来决策结果的偏见或不确定性的表示。
- 关于人类和机器的意识功能和普通智能之间联系的研究
本文探讨了意识和智能之间的联系,发现意识与人类领域普适智能有密切关系。对比三种当代意识功能理论与人类的认知能力,作者将结论应用到人工智能领域,提出了一种将三种理论相结合的可实现的模型,并以人类的心理时间旅行为例,提出进行人工智能研究的前景和 - CVPR语义视频预测中的模块化行动概念建模
该研究介绍了使用语义动作标签作为反向问题进行预测的方法,提出了一种名为模块化动作概念网络的视频预测模型,该模型可以生成对应的未来帧且无需边界框,还可以用于物体检测和高层次的认知任务。
- NIPS用于视觉问答的高阶注意力模型
本文提出了一种新颖且通用的注意力机制,可以学习不同数据模态之间的高阶相关性。 作者实验证明高阶相关性可以将适当的关注点引导到不同数据模态中的相关元素,来更好地解决联合任务,如视觉问答(VQA),在 VQA 标准数据集上实现了最先进的性能。