BriefGPT.xyz
大模型
Ask
alpha
关键词
arabic language models
搜索结果 - 4
101 亿阿拉伯语词汇数据集
该研究致力于解决阿拉伯地区数据稀缺的问题,以鼓励开发真实地反映该地区语言和细微差异的阿拉伯语言模型。通过从 Common Crawl WET 文件中提取大量阿拉伯文本数据,经过严格的清洗和去重处理,形成了迄今为止最大的 1010 亿阿拉伯词
→
PDF
2 months ago
对增强的阿拉伯语语言模型的分词策略和词汇量进行探索
本研究通过考察不同的分词策略和词汇量对阿拉伯语言模型在自然语言处理任务中的表现影响,全面探究了其对新闻分类、仇恨言论检测、情感分析和自然语言推理等多个任务的有效性。结果显示,Farasa 的字节对编码 (BPE) 在多个任务中表现优于其他策
→
PDF
4 months ago
JASMINE: 用于少样本学习的阿拉伯文 GPT 模型
该论文介绍了一个用于阿拉伯语的强大的自回归 Transformer 语言模型套件 JASMINE,用于 zero 和 few-shot 学习和广泛的 NLP 任务基准测试,旨在填补该领域在不同语言环境和文化中的问题和缺陷以及在这些模型中潜在
→
PDF
2 years ago
阿拉伯预训练语言模型中变体、大小和任务类型的相互作用
本文研究了阿拉伯语预训练语言模型的语言变体、数据量和微调任务类型对其效果的影响,结论表明预训练数据与微调数据的相似性对模型的性能更为重要。
PDF
3 years ago
Prev
Next