Dec, 2024

朝向学习推理:大型语言模型与神经符号方法在抽象推理中的算术关系比较

TL;DR本研究比较了大型语言模型(LLMs)和神经符号方法在解决拉文的渐进矩阵(RPM)中的表现,该测试涉及数学规则的理解。尽管提供了结构化的表示,GPT-4和Llama-3 70B仍未达到完美准确率,分析表明LLM在理解和执行算术规则方面存在局限,而神经符号方法ARLC在此领域展现出几乎完美的准确率,提供了一种潜在的改进方案。