Aug, 2023

WALL-E 的想象力:为先进 AI 系统重构体验的想象力启发模块

TL;DR介绍了一种受到哲学和精神分析概念启发的人工智能系统,利用想象力将文本输入与其他模态进行连接,从先前学习的经验中丰富所得信息。该系统具备独立感知输入的能力,导致概念的独特解释,虽然与人的解释可能不同但同样有效,该现象被称为 “可解释性误解”。通过使用大规模模型,如多模式大型语言模型 (MLLM),我们评估了系统在情感识别和问答等多个任务上的表现,采用零样本方法以确保无偏执的情况。该系统在 MELD、IEMOCAP 和 CoQA 数据集上大幅优于最佳大型语言模型 (LLM),权重 F1 分别分别为 46.74%、25.23% 和总 F1 分数为 17%,相比表现良好的 LLM 的 22.89%、12.28% 和 7%。旨在超越语言处理的统计视角,将其与哲学和精神分析等人类概念相结合。这项工作在想象力启发的人工智能系统的发展方面取得了重大进展,为人工智能跨模态生成深度且可解释的信息,从而增强人机交互提供了新的可能性。