面向概念感知的大型语言模型

EMNLPNov, 2023

Towards Concept-Aware Large Language Models

Chen Shani, Jilles Vreeken, Dafna Shahaf

TL;DR在本研究中，我们分析了当代大型语言模型对人类概念及其结构的理解程度，并讨论了发展具备概念意识的语言模型的方法，包括在不同阶段引入预训练和利用现有语言模型输出的简化方法。通过证明概念意识语言模型的初步结果，我们证明了其能够更好地符合人类直觉，提高了预测的稳定性，展示出了概念意识语言模型的潜力。

Abstract

concepts play a pivotal role in various human cognitive functions, including learning, →

concepts cognitive functions learning reasoning communication

发现论文，激发创造

基于概念的大语言模型深度学习

本文讨论大型语言模型在概念导向深度学习方面的应用，以及利用多模态语言模型进行概念提取、图谱提取和概念学习等方面的研究。同时，本文认为，虽然 LLM 在概念导向深度学习方面的应用颇具价值，但作为人工智能聊天机器人的应用，它更具有实用价值。

Jun, 2023

大型语言模型中的无参考意义

本文讨论大型语言模型是否存在人类概念或含义，并指出语言模型可能捕捉了重要的含义方面，这符合人类认知的合理解释。由于概念角色由内部表示状态之间的关系定义，因此含义不能从模型的体系结构，训练数据或目标函数中确定，而只能通过研究其内部状态之间的关系来确定。

Aug, 2022

LLM 模型的概念归纳：用于评估的用户实验

通过利用 GPT-4 的领域知识和常识能力，我们探索了大型语言模型在图像分类特定环境中生成高级概念作为人类解释的潜力，并通过人类研究评估了其有效性。

Apr, 2024

用 LLMs 推理概念：充斥着不一致

知识的总结和组织对于学习和推理至关重要。我们展示了大型语言模型在知识方面存在显著的不一致性。通过使用简单的知识图谱，我们能够揭示语言模型中的概念上的不一致性，并提出了改进语言模型的策略。

May, 2024

论大型语言模型

本文旨在提倡对大型语言模型及其相关系统的实际工作进行重新审视，追求更高的科学精度以引领关于人工智能的哲学探索和公众话语。

Dec, 2022

语言模型中的概念和公正推理

我们提出了一个新的概念化框架，迫使模型在抽象问题上进行概念推理并在可验证的符号空间中生成解决方案，使用这个框架作为分析工具，我们发现现有的大型语言模型在概念推理方面存在不足，并通过引入可信的归纳信号来改善模型的概念推理性能，实验证明我们提出的技术使模型的概念推理性能提高了 8% 至 11%，实现了一个更强大的推理系统，更少地依赖归纳偏见。

Mar, 2024

我思故我在：大型语言模型中的意识

大型语言模型是否具有类似于人类的任何形式的知觉？本文介绍了将知觉概念引入到大型语言模型中，认为知觉是增强大型语言模型与人类互动并确保其道德回应的重要方面。我们定义大型语言模型的知觉为其作为 AI 模型感知和理解自己，以及展现社交智能的能力。我们确定了四个关键方面的知觉：能力，使命，情感和视角。为了评估大型语言模型在这些方面的表现，我们引入了一个专门的数据集，即 AwareLLM 数据集。我们的研究结果表明，大型语言模型展现了一定程度的知觉，尽管它们仍然缺乏实质性的能力知觉。

Jan, 2024

大型语言模型是否遵循概念注释指南？科学和金融领域案例研究

大语言模型通过指导文本对句子进行标记涉及了利用上下文示例的广泛语言模型，根据我们的简单评估方法，我们发现开源语言模型与领先的专有 API 之间在概念理解方面存在显著差距。

Nov, 2023

大型知识模型：视角与挑战

人类对世界的理解与我们的感知和认知密切相关，其中人类语言作为世界知识的重要承载者之一。本文通过 “知识” 这个视角来探索大型模型，并讨论符号知识如何增强大型语言模型以及大型语言模型如何扩展传统符号知识基础。考虑到人类知识的复杂性，我们倡导创建专门管理多样化知识结构的大型知识模型，并提出了五个 “A” 原则来区分 LKM 的概念。

Dec, 2023

大型语言模型在语言学习中的口语智能

评估大语言模型在教育中的功效，特别是在口语学习领域，引入新的多选题数据集评估模型在理解和应用口语知识方面的表现，研究不同提示技术对模型性能的影响，发现模型在音韵学、语音学和第二语言习得方面具有良好的概念理解，但在解决现实世界问题的推理方面存在限制，并初步探讨了对话交流的发现。

Aug, 2023