BriefGPT.xyz
Ask
alpha
关键词
computational abilities
搜索结果 - 2
TACT: 提高复杂聚合推理的信息提取工具
使用 TACT 数据集评估了大型语言模型(LLMs)的推理和计算能力,发现现有模型在整合分散信息和执行复杂集成任务方面表现不佳。提出了一个名为 IE 作为工具的新建模型框架,通过为每个步骤添加工具并采用 few-shot prompting
→
PDF
a month ago
机器与儿童的比较:使用发展心理学实验评估 LaMDA 响应的优缺点
利用儿童发展心理学经典实验评估大型语言模型(LLMs)的能力,提出一种评估 LLMs 能力的 LRS 度量,将 Google 的 LaMDA 模型应用于实验,发现 LaMDA 在社交认知任务中回答的适当反应与儿童相似,但在早期物体行为认知、
→
PDF
a year ago
Prev
Next