BriefGPT.xyz
大模型
Ask
alpha
关键词
annotations projection
搜索结果 - 1
PAXQA: 在训练规模上生成跨语言问答实例
本文提出了一种利用现有平行语料库进行间接监督的跨语言问答(QA)的合成数据生成方法,并使用词汇约束的机器翻译提高翻译质量,生成了跨越 4 种语言的 662K QA 样例数据集,并通过消融研究证明了该方法相对于自动单词对齐的噪声比较稳健。
PDF
a year ago
Prev
Next