llma | BriefGPT - AI 论文速递

关键词llma

搜索结果 - 4

SIGIR利用大型语言模型进行改写和聚合以最小化意图分类错误
大型语言模型在自然语言生成方面取得了显著的成功，但在决策任务如分类方面的适用性却鲜有关注。本文提出了 PAG-LLM 方法，通过生成原始查询和多个并行查询的多次释义、多类别分类以及根据置信度得分对所有分类标签进行聚合，以解决大型多类别分类任
PDF12 days ago
意大利语的先进基于自然的交互：LLaMAntino-3-ANITA
为了推进意大利语的自然语言处理，我们引入了一种基于新型 Meta LLaMA-3 模型的最先进的大型语言模型（LLM）: LLaMAntino-3-ANITA-8B-Inst-DPO-ITA。我们使用英语和意大利语语料库上的监督微调（SFT
PDF2 months ago
从文字到瓦特：大型语言模型推理的能源成本基准测试
大型语言模型（LLMs）的计算和能源资源利用的推理性能进行了基准测试和初步分析，分析了不同规模的 LLMa 在两代热门 GPU（NVIDIA V100 和 A100）以及两个数据集（Alpaca 和 GSM8K）上的推理性能与推理能源成本。
PDF9 months ago
参考推理：大语言模型的无损加速
LLMA 是一种基于并行计算的 LLM 加速器，通过在一次解码步骤中选择参考文本并将其标记复制到解码器，即可实现对 LLM 的推理加速并提高计算并行性，使其在多种实际生成场景中生成结果与贪婪解码相同，达到 2 倍以上的加速。
PDFa year ago