May, 2024
大型语言模型中的跨域对齐揭示出人类类似的模式
A Nurse is Blue and Elephant is Rugby: Cross Domain Alignment in Large Language Models Reveal Human-like Patterns
Asaf Yehudai, Taelin Karidi, Gabriel Stanovsky, Ariel Goldstein, Omri Abend
TL;DR本文通过行为研究,评估大型语言模型(LLMs)的概念化和推理能力,使用跨领域映射任务并分析模型的响应,结果显示模型的表示和行为与人类相似。