BriefGPT.xyz
大模型
Ask
alpha
关键词
typologically diverse languages
搜索结果 - 4
语言模型是多语言的思维链推理器
通过使用多种类型不同的语言,我们通过手动将 GSM8K 数据集中的 250 个小学数学问题翻译成十种不同的语言,评估了大型语言模型在多语种环境下的推理能力,并提出了 MGSM 基准。我们发现,随着模型规模的增加,使用思维链提示解决 MGSM
→
PDF
2 years ago
零样本跨语言事件语义学习
本文研究跨语言识别图像标题中的语言学方面,通过计算模型可以准确预测词法方面,无需直接观察全部注释数据即可在尚未观察到的语言上进行词法方面的预测。
PDF
2 years ago
Meta-X_{NLG}: 一种基于语言聚类的元学习方法,用于零样本跨语言传输和生成
本文提出了一种基于元学习和语言聚类的元学习框架(Meta-X$_{NLG}$),从不同的语言中学习可共享的结构,以实现对未知语言的统一跨语种转移。在两个自动生成任务(提取型文本摘要和问题生成)以及 30 种类型各异的语言和 5 个广泛使用的
→
PDF
2 years ago
ACL
你的分词器有多好?多语言语言模型在单语言性能上的表现
通过在九种语言和五种单语言任务的实验中对比预训练的多语言和单语言模型的表现来研究它们之间的差异,结果表明预训练数据规模和专门的单语言分词器对于下游性能同样重要,而对于具有多语言模型词汇表适当表示的语言的性能下降可以忽略不计。使用专门的单语言
→
PDF
4 years ago
Prev
Next