面向概念感知的大型语言模型
本文讨论大型语言模型在概念导向深度学习方面的应用,以及利用多模态语言模型进行概念提取、图谱提取和概念学习等方面的研究。同时,本文认为,虽然 LLM 在概念导向深度学习方面的应用颇具价值,但作为人工智能聊天机器人的应用, 它更具有实用价值。
Jun, 2023
本文讨论大型语言模型是否存在人类概念或含义,并指出语言模型可能捕捉了重要的含义方面,这符合人类认知的合理解释。由于概念角色由内部表示状态之间的关系定义,因此含义不能从模型的体系结构,训练数据或目标函数中确定,而只能通过研究其内部状态之间的关系来确定。
Aug, 2022
通过利用 GPT-4 的领域知识和常识能力,我们探索了大型语言模型在图像分类特定环境中生成高级概念作为人类解释的潜力,并通过人类研究评估了其有效性。
Apr, 2024
知识的总结和组织对于学习和推理至关重要。我们展示了大型语言模型在知识方面存在显著的不一致性。通过使用简单的知识图谱,我们能够揭示语言模型中的概念上的不一致性,并提出了改进语言模型的策略。
May, 2024
我们提出了一个新的概念化框架,迫使模型在抽象问题上进行概念推理并在可验证的符号空间中生成解决方案,使用这个框架作为分析工具,我们发现现有的大型语言模型在概念推理方面存在不足,并通过引入可信的归纳信号来改善模型的概念推理性能,实验证明我们提出的技术使模型的概念推理性能提高了 8% 至 11%,实现了一个更强大的推理系统,更少地依赖归纳偏见。
Mar, 2024
大型语言模型是否具有类似于人类的任何形式的知觉?本文介绍了将知觉概念引入到大型语言模型中,认为知觉是增强大型语言模型与人类互动并确保其道德回应的重要方面。我们定义大型语言模型的知觉为其作为 AI 模型感知和理解自己,以及展现社交智能的能力。我们确定了四个关键方面的知觉:能力,使命,情感和视角。为了评估大型语言模型在这些方面的表现,我们引入了一个专门的数据集,即 AwareLLM 数据集。我们的研究结果表明,大型语言模型展现了一定程度的知觉,尽管它们仍然缺乏实质性的能力知觉。
Jan, 2024
大语言模型通过指导文本对句子进行标记涉及了利用上下文示例的广泛语言模型,根据我们的简单评估方法,我们发现开源语言模型与领先的专有 API 之间在概念理解方面存在显著差距。
Nov, 2023
人类对世界的理解与我们的感知和认知密切相关,其中人类语言作为世界知识的重要承载者之一。本文通过 “知识” 这个视角来探索大型模型,并讨论符号知识如何增强大型语言模型以及大型语言模型如何扩展传统符号知识基础。考虑到人类知识的复杂性,我们倡导创建专门管理多样化知识结构的大型知识模型,并提出了五个 “A” 原则来区分 LKM 的概念。
Dec, 2023
评估大语言模型在教育中的功效,特别是在口语学习领域,引入新的多选题数据集评估模型在理解和应用口语知识方面的表现,研究不同提示技术对模型性能的影响,发现模型在音韵学、语音学和第二语言习得方面具有良好的概念理解,但在解决现实世界问题的推理方面存在限制,并初步探讨了对话交流的发现。
Aug, 2023