BriefGPT.xyz
Ask
alpha
关键词
supervised encoder-decoder models
搜索结果 - 2
通过持续预训练并行数据提高大型语言模型的翻译准确性
通过两阶段训练方法,即不断在并行数据上预训练大型语言模型并在少量高质量并行数据上进行有监督微调,我们证明了这种方法的有效性。我们的研究表明,在并行数据的持续预训练中,在源句和目标句之间交替使用是至关重要的。此外,我们还证明了基于 LLM 的
→
PDF
3 days ago
COLING
通过反射预测改进的神经原型重建
通过运用反射预测模型对重构模型中的候选原型进行重新排序,我们的研究在三个中国和罗曼语数据集中超越了最先进的原型重建方法。
PDF
3 months ago
Prev
Next