BriefGPT.xyz
Ask
alpha
关键词
tokenization strategies
搜索结果 - 1
对增强的阿拉伯语语言模型的分词策略和词汇量进行探索
本研究通过考察不同的分词策略和词汇量对阿拉伯语言模型在自然语言处理任务中的表现影响,全面探究了其对新闻分类、仇恨言论检测、情感分析和自然语言推理等多个任务的有效性。结果显示,Farasa 的字节对编码 (BPE) 在多个任务中表现优于其他策
→
PDF
4 months ago
Prev
Next