BriefGPT.xyz
Ask
alpha
关键词
llma
搜索结果 - 4
SIGIR
利用大型语言模型进行改写和聚合以最小化意图分类错误
大型语言模型在自然语言生成方面取得了显著的成功,但在决策任务如分类方面的适用性却鲜有关注。本文提出了 PAG-LLM 方法,通过生成原始查询和多个并行查询的多次释义、多类别分类以及根据置信度得分对所有分类标签进行聚合,以解决大型多类别分类任
→
PDF
12 days ago
意大利语的先进基于自然的交互:LLaMAntino-3-ANITA
为了推进意大利语的自然语言处理,我们引入了一种基于新型 Meta LLaMA-3 模型的最先进的大型语言模型(LLM): LLaMAntino-3-ANITA-8B-Inst-DPO-ITA。我们使用英语和意大利语语料库上的监督微调(SFT
→
PDF
2 months ago
从文字到瓦特:大型语言模型推理的能源成本基准测试
大型语言模型(LLMs)的计算和能源资源利用的推理性能进行了基准测试和初步分析,分析了不同规模的 LLMa 在两代热门 GPU(NVIDIA V100 和 A100)以及两个数据集(Alpaca 和 GSM8K)上的推理性能与推理能源成本。
PDF
9 months ago
参考推理:大语言模型的无损加速
LLMA 是一种基于并行计算的 LLM 加速器,通过在一次解码步骤中选择参考文本并将其标记复制到解码器,即可实现对 LLM 的推理加速并提高计算并行性,使其在多种实际生成场景中生成结果与贪婪解码相同,达到 2 倍以上的加速。
PDF
a year ago
Prev
Next