BriefGPT.xyz
Ask
alpha
关键词
morphologically-aligned tokenization
搜索结果 - 1
不同的分词方法在西班牙语数字协议中的性能相当
语言模型标记化与性能之间的关系是一个开放的研究领域。我们研究了不同标记化方案如何影响西班牙语复数的数一致性。我们发现,形态对齐标记化与其他标记化方案的表现相似,即使在对训练过程中不会进行这种标记化的单词人工引导下。我们还进行了探索性分析,显
→
PDF
4 months ago
Prev
Next