BriefGPT.xyz
大模型
Ask
alpha
关键词
encoder-only language models
搜索结果 - 4
阿塞拜疆语开放基础模型
本研究论文介绍了针对阿塞拜疆语的多语种大型语言模型的开源基础模型,包括大规模文本语料库、仅编码器语言模型的系列以及用于评估该模型的标注数据集,并对支持阿塞拜疆语的所有主要开源模型进行了广泛评估。
PDF
2 days ago
简单有效的遮掩扩散语言模型
简化的掩码离散扩散模型在语言建模方面的性能优于以往认为的水平,可以用于训练只有编码器的高效采样语言模型,并在语言建模基准测试中取得了最新的最佳结果。
PDF
23 days ago
EMNLP
迷失翻译,发现片段:多语言社交媒体中的索引辨识
CSI 是事实核查流程中的重要步骤,该文档旨在通过创建一个多语言数据集 X-CLAIM,展示基于高资源语言英语进行训练,以及使用编码器模型相比较大的生成式语言模型在低资源语言上带来的明显优势。
PDF
8 months ago
EMNLP
ChatGPT 是否是金融专家?对语言模型在金融自然语言处理的评估
使用 FinLMEval 框架评估了大型语言模型在金融领域中的能力,并发现虽然一些只有解码器的 LLM 在大多数金融任务中表现出色,尤其是通过零 - shot 提示,但它们在处理专有数据集时通常落后于经过精调的专家模型。该研究为在金融领域构
→
PDF
8 months ago
Prev
Next