BriefGPT.xyz
大模型
Ask
alpha
关键词
instruction-tuning dataset
搜索结果 - 3
ChartLlama: 图表理解和生成的多模态 LLM
通过创建高质量的指令调整数据集,并使用这个数据集训练多模态大型语言模型 ChartLlama,本研究提出的数据生成方法可以有效地提高图表理解能力,并在 ChartQA、图表转文本和图表提取等评估中明显超越以往的方法,证实了其巨大潜力。
PDF
7 months ago
ToolLLM: 促进大型语言模型掌握 16000 + 现实世界 API
通过引入 ToolLLM,一个包括数据构建、模型训练和评估的通用工具使用框架,我们展示了它在增强自然语言模型的规划和推理能力方面的显著影响。我们通过用 ChatGPT 创建一个工具使用指导数据集 ToolBench,并使用深度优先搜索决策树
→
PDF
a year ago
CoT 集合:通过思维链微调改善语言模型的零样本和少样本学习
通过不同程度的 fine-tuning,基于 Flan-T5 的大型语言模型学习了 Chain-of-Thought 推理并表现出更强的 few-shot learning 能力,使得在 27 个数据集上的平均零 - shot 准确率提高了
→
PDF
a year ago
Prev
Next