BriefGPT.xyz
大模型
Ask
alpha
关键词
math reasoning datasets
搜索结果 - 2
DICE:检测数学推理中 LLM 微调阶段的内分布污染
该研究提出了一种名为 DICE 的新方法,通过使用大型语言模型的内部状态来检测分布内的污染,该方法在各种大型语言模型和数学推理数据集上具有高准确性,指出分布内的污染问题可能导致对现有模型真实能力的过高估计。
PDF
a month ago
LLM-Adapters:用于大型语言模型参数高效微调的适配器家族
本文提出 LLMs-Adapters 框架,利用少量可调参数对小型 LLMs 进行 fine-tuning,实现对各种任务的支持;在六种数学推理数据集上的实验表明,将 adapter-based PEFT 应用于小型 LLMs(7B)可以取
→
PDF
a year ago
Prev
Next