BriefGPT.xyz
大模型
Ask
alpha
关键词
llm research
搜索结果 - 4
GECKO: 英文、程式碼和韓文的生成語言模型
GECKO 是一种针对韩语和英语以及编程语言进行优化的双语大型语言模型 (LLM),通过 LLaMA 架构在平衡、高质量的韩语和英语语料库上进行预训练。该模型在韩语和英语的令牌生成效率上表现出色,尽管其词汇量较小。希望此研究能为韩语 LLM
→
PDF
a month ago
Mercury: LLM 代码综合效率评估
Mercury 是第一个用于评估 LLM 代码综合任务的基准,它综合了 1889 个编程任务,覆盖不同的难度级别,并通过基于历史提交的标准化代码效率度量 Beyond@K,提供了一种评估代码综合的新指标,鼓励生成在功能正确和计算高效方面都优
→
PDF
5 months ago
超越文本:通过 MultiAPI 基准评估揭示大型语言模型的多模态能力
聊天 GPT 通过开发的 MultiAPI 数据集评估了多模态任务中大型语言模型的表现,研究发现在 API 调用决策、领域识别、功能选择和参数生成等方面存在挑战,并提出了解决这些问题的新方法,为未来 LLM 研究指明了方向。
PDF
7 months ago
基于有效评估模型提取的大规模高质量中文网络文本
我们提出了 EvalWeb,一种从嘈杂的网络数据中提取中文干净文本的完整工具链,用于帮助大型语言模型的研究。使用这种方法,我们发布了最大和最新的大规模高质量中文网络文本 ChineseWebText,其中包含 1.42 TB 的文本,并为每
→
PDF
8 months ago
Prev
Next